音频

Video Candy

一款在线视频编辑器,Video Candy提供一系列用于编辑和增强视频的工具,界面友好、100%免费使用,无需帐户,可以直接通过网络浏览器访问使用。

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型,基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列,通过掩码处理和去噪生成高质量音频,保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能,具有非自回归特性,提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

Pollinations.AI

Pollinations.AI是一个开源AI内容生成平台,提供图像生成、文本生成、音频转换及视觉分析等功能。用户无需注册即可使用,支持多种模型和参数配置,适合开发者和创作者快速集成与应用。平台还提供浏览器开发环境,简化了使用流程,提升了效率。

SoundRaw AI

面向创作者的 AI 音乐生成器,只需选择情绪、流派和长度,SoundRaw AI就能为你生成优美的歌曲。

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具,支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项,适用于视频制作、播客、教育、营销等多种场景,助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作,适合个人与企业用户使用。

Whisper

Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

声咖

只需导入文本或上传已录制的音频,选择音色,即可生成高品质的小说配音音频内容。

PhonicMind

PhonicMind是一款利用AI技术的专业音频处理工具,专注于人声移除和乐器分离。它支持多种音频格式,提供从卡拉OK制作到音乐混音的全面功能,满足音乐制作、声乐练习及教育等多种应用场景的需求。其直观的操作界面和高质量的音频处理能力使其成为音乐爱好者的理想选择。

UVR5

UVR5,终极人声去除器,使用先进的 AI技术,从音视频提取伴奏,简单易用、无需注册即可使用来获取高质量的伴奏和其他音轨文件。

Podcastle

Podcastle是一款以AI为核心的播客制作平台,集成了录音室、音频与视频编辑器及AI生成的声音工具,支持本地多人协作录音、降噪处理、品牌定制化功能及声音克隆技术。该平台覆盖从创意到发布的全链条服务,并支持内容托管与多平台分发,适用于个人播客、远程采访、教育培训、企业沟通及有声读物制作等多种场景。