音频 - 智狐AI导航

covers.ai

covers.ai是一款基于AI技术的音乐创作平台，提供AI语音生成与AI歌曲生成功能。用户可通过简单操作，如演唱或哼唱，由AI自动完成音乐制作，生成个性化歌曲。平台支持多种音乐风格，并允许用户自定义声音效果，适合音乐爱好者、初学者及创作者使用。其操作便捷、创意性强，有助于激发音乐灵感并提升创作效率。

AI项目与工具 2025年06月12日 31 点赞 0 评论 661 浏览

Jammable

Jammable是一款基于AI技术的音乐创作平台，用户可通过选择特定歌手声音或音乐风格，生成个性化的翻唱作品。平台提供快速生成、个性化定制、热门趋势展示及社区互动等功能，适用于音乐创作者、爱好者及教育领域。支持多种应用场景，如个人创作、社交媒体内容制作及创意合作，提升音乐创作效率与多样性。

AI项目与工具 2025年06月12日 88 点赞 0 评论 676 浏览

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台，支持人声替换、声音克隆、文本转语音及音频分离等功能，提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成，适用于多种应用场景，如语言学习、娱乐互动等。

AI项目与工具 2025年06月12日 57 点赞 0 评论 602 浏览

GenSFX

GenSFX 是一款基于 AI 的在线音效生成工具，可根据文本描述快速生成高质量音效，支持环境音、自然声、动物叫声、机械声、科幻音效等多种类型。用户可自定义参数并下载多种格式的音频文件，适用于视频制作、游戏开发、播客和广告等多个领域，提升内容创作效率与表现力。

AI项目与工具 2025年06月12日 94 点赞 0 评论 662 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 601 浏览

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架，基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器，提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色，具备高稳定性与自然连贯性，支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 811 浏览

MUSIC.AI

MUSIC.AI 是一款基于人工智能的音频处理平台，提供音频分离、混音、母带处理、语音转换、歌词转录等功能，支持多语言翻译与本地化。平台已处理超 10 亿分钟音频，服务数千万用户，适用于音乐制作、视频剪辑及现场演出等多种场景，显著提升音频处理效率与质量。

AI项目与工具 2025年06月12日 93 点赞 0 评论 877 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 725 浏览

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架，能够实现唇部动作与音频信号的精准同步，并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑，基于130小时中文视频数据集训练，在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域，为视频内容创作提供了创新解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 491 浏览

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具，可将视频中的唇部动作转换为文字，支持多语言和口音识别。其高精度算法确保了文字输出的准确性，适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便，处理高效，注重用户数据隐私保护，适合专业用户和普通用户使用。

AI项目与工具 2025年06月12日 100 点赞 0 评论 912 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期