语音 - 智狐AI导航

Narration Box

Narration Box是一种语音合成服务，用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者，支持20多种语言，功能强大的语音编辑器，...

创作工具 2026年06月24日 0 点赞 0 评论 715 浏览

大饼AI变声

大饼AI变声，自然人声效果，千种音色选择，全场景接入支持，专注于声音领域，除了实时变声，大饼AI变声还为声音从业者打造了音色转换工具，为内容创作者提供了文本转语音等功能。

Ai语音工具 2025年06月05日 47 点赞 0 评论 715 浏览

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频，通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情，PoseVAE合成不同风格的头部运动，并采用3D面部渲染技术，实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力，适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

AI项目与工具 2025年06月12日 71 点赞 0 评论 714 浏览

Murf AI

Murf AI 是一款文本转语音软件，它能够将真实声音与免版税音乐和视频相结合。

Ai语音工具 2025年06月05日 27 点赞 0 评论 714 浏览

AI Chinese

AI Chinese是一款利用AI技术打造的双语中文学习平台，提供个性化的在线教学服务。其核心功能包括AI模拟教学、双语教学支持、互动练习、语音识别与校正及提问解答等模块，能够满足个人自学、语言学校辅助教学、企业培训等多种应用场景需求。凭借自研中文知识图谱和精准语音反馈，该平台致力于帮助不同语言背景的学习者高效掌握中文。

AI项目与工具 2025年06月12日 98 点赞 0 评论 713 浏览

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 712 浏览

讯飞配音

提供文字转语音、语音合成、国内专业的一站式配音服务平台

字幕配音 2025年06月05日 53 点赞 0 评论 712 浏览

OmniTalker

OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术，支持文本、图像、音频和视频的同步处理，并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术，实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景，具有高实时性与稳定性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 711 浏览

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别（ASR）模型，采用 FastConformer 和 TDT 架构，具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异，实时因子高达 3386，适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

AI项目与工具 2025年06月11日 36 点赞 0 评论 711 浏览

Vid.AI

一个爆款短视频生成AI工具并优化这些视频以提高在社交媒体上的传播率，提供提示生成视频、AI 脚本生成、AI 声音、短视频创作和内置的素材库。

Ai视频生成 2025年06月05日 71 点赞 0 评论 710 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期