语音 - 智狐AI导航

ChatPaper.ai

一个论文、视频、笔记的AI总结学习助手，轻松提炼论文精华、整理课堂重点、生成会议纪要。基于先进AI技术，支持多语言处理，为学生、研究者和职场人士量身打造。

Ai语音工具 2025年06月05日 44 点赞 0 评论 744 浏览

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 744 浏览

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 744 浏览

Vidnoz

Vidnoz是一款基于AI的在线视频生成工具，拥有超过1200个逼真的虚拟形象、470多种语言支持及900多个视频模板，支持从文本到视频的全流程制作。其主要功能包括AI虚拟形象生成、文字转语音、视频模板应用、智能编辑、语音克隆以及静态图片动态化处理，广泛应用于社交媒体营销、在线教育、企业培训、产品宣传等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 744 浏览

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 743 浏览

日日新SenseNova V6

日日新SenseNova V6是商汤科技推出的第六代多模态大模型，基于6000亿参数架构，支持文本、图像、视频的原生融合。具备强推理、长记忆与情感表达能力，适用于视频分析、教育辅导、智能客服、具身智能等多个领域，提升交互体验与内容处理效率。

AI项目与工具 2025年06月11日 19 点赞 0 评论 741 浏览

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务，支持联网搜索、文件上传、多模态处理等功能，运行流畅稳定。平台在多项实测中表现优异，具备深度思考能力、智能追问及语音交互功能，适用于多种场景，用户体验良好，且完全免费。

AI项目与工具 2025年06月12日 12 点赞 0 评论 740 浏览

声动视界SoundView

一款面向带货短视频的AI视频工具，声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

Ai语音工具 2025年06月05日 58 点赞 0 评论 739 浏览

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 738 浏览

音鹿

音鹿是一款基于AI技术的音频编辑工具，主要功能包括文字转语音、音色选择、AI翻唱及音频编辑（剪切、合并、混音、音量调节、变速变调）。该工具内置大量音色模型，支持实时预览与参数调整，广泛适用于社交媒体、广告宣传、教育培训等领域，帮助用户高效完成音频创作。

AI项目与工具 2025年06月12日 73 点赞 0 评论 738 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期