语音

酷音

酷音网是一个真人配音与AI配音、视频拍摄与制作、音乐作词与谱曲、视频策划与创意等领域的创作、交易、推广运营于一体的音视频交易服务平台,致力于打造专注音视频领域的商业生态圈。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Vozo AI

一款AI视频生成器,Vozo AI通过重新编写、重新配音、编辑声音,然后通过提示将现有视频配音成新的视频故事。用户可以轻松将视频转换为宣传片、喜剧或多语言版本。

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理!

清图

清图 - 模糊图片秒变清晰,一个基于深度学习技术的在线图像处理平台

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。

麦句

不仅为用户提供了一种新颖的娱乐方式,也为需要情感支持和交流的人提供了一个平台。

Koko AI

一款具有AI生成的3D模型和语音聊天功能的社交娱乐应用,Koko AI融合了3D模型、动画表演和语音聊天技术,为用户提供了与动漫角色进行面对面的互动体验。

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型,利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务,如音乐创作、声音效果设计及语音合成,并可通过ComposableART技术实现对声音属性的精细调控。此外,Fugatto擅长生成动态变化的声音景观,广泛应用于音乐创作、声音设计及广告音频制作等领域。