语音 - 智狐AI导航

Glimmer AI

一款使用GPT-3和DALL·E 2进行AI支持的ppt演示工具，根据用户的文本和语音指令生成视觉非常出色的PPT演示文稿。

PPT资源 2025年06月05日 96 点赞 0 评论 701 浏览

Soundverse AI

一个利用生成式人工智能的音乐创作平台，Soundverse AI提供免费的 AI 音乐生成器和语音助手，帮助音乐创作者轻松制作高质量的音乐。

Ai语音工具 2025年06月05日 80 点赞 0 评论 701 浏览

SpeechEasy

SpeechEasy是一种合成语音解决方案，可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台，支持桌面和移动设备，有近12种高质量的合成声音可供选择。它使用简单...

Ai语音工具 2026年06月24日 0 点赞 0 评论 702 浏览

Rask.ai

Rask.ai平台以其自动化和智能化的翻译及配音服务，帮助企业节省时间和成本，同时提高内容的全球可访问性。

创作工具 2026年06月24日 0 点赞 0 评论 702 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 702 浏览

SlideSpeak

SlideSpeak是一款基于AI技术的多功能工具，支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外，SlideSpeak强调数据安全性，适用于学术研究、商业演示、教育培训等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 703 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 703 浏览

GTSinger

GTSinger是一项由浙江大学研发的开源高质量歌声数据集，包含80.59小时的多语言专业录音棚歌声数据，支持歌声合成、技巧识别、风格迁移和语音到歌声转换等多种任务。它通过音素级标注和真实乐谱支持，为歌唱技巧的研究和应用提供了强大工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 703 浏览

DeepL

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务，可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Ai语音工具 2026年06月24日 0 点赞 0 评论 704 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 704 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期