音频

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具,支持超过30种性别和语言的声音选择,用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件,适用于产品演示、教育培训、营销推广等多种场景,助力高效生成高质量语音内容。

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

Stability AI

Stability AI提供了一套完整的生成式AI模型,覆盖图像、视频和音频等多个领域,旨在推动AI技术的普及和应用。

CoGenAV

CoGenAV是一种先进的多模态学习模型,专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练,利用同步音频、视频和文本数据,学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能,适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

通义万相AI视频

通义万相AI视频是一款基于人工智能的视频生成工具,支持文生视频和图生视频两种模式。用户可输入文字描述或上传图片生成高质量视频,支持多语言、多种艺术风格及音频生成功能,优化中式元素表现,广泛应用于影视、广告、动画设计等多个领域。

Songtell

Songtell是第一个人工智能生成的歌曲含义库,生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

苏诺suno

苏诺是一个歌曲创作平台,它鼓励用户围绕任何主题创作歌曲。

Altered AI

Altered Studio Voice Editor允许用户通过将他们的声音更改为任何精心策划的组合声音或自定义声音来创建专业的声音表演。它还允许用户创建引人入胜的多角色表演和克隆他们的声音。...

Emergent Drums

使用Emergent Drums人工智能生成独特的鼓样本,使用Audialab插件生成无限的鼓样本,全部免版税。