语音 - 智狐AI导航

Voiceflow

Voiceflow 是一款面向非技术用户的无代码对话式 AI 平台，具备直观的拖放界面和强大的自然语言处理能力。它支持复杂对话流程的设计、多渠道部署及团队协作，适用于客户服务自动化、虚拟助手开发、语音交互系统构建等多个领域，为企业和个人提供灵活且高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 820 浏览

clone

Clone-Voice是一款基于深度学习的声音克隆工具，支持16种语言的文本转语音及声音风格转换，具有友好的操作界面和较低的硬件要求。它被广泛应用于视频制作、语言学习、有声出版物创作、广告宣传及游戏开发等领域，为用户提供多样化的个性化声音解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 820 浏览

悦录

悦录依托同花顺的语音识别技术，为用户提供免费的录音转文字、语音转文字、视频字幕等服务，1小时音频最快5分钟出稿，准确率高达97%+，全程加密，文件信息安全。

创作工具 2026年06月23日 0 点赞 0 评论 818 浏览

音子AI

音子AI利用人工智能技术提供了一系列便捷的音频处理服务，无论是音乐制作的音轨分离，还是有声读物的文本转语音，都能满足用户的不同需求。

创作工具 2026年06月23日 0 点赞 0 评论 818 浏览

新壹视频大模型

新壹视频大模型是一款AI驱动的视频创作平台，具备自动生成剧本、情感化语音合成、3D元素生成和高清视频输出等功能。该平台通过集成自主研发的AI算法和深度学习技术，简化了视频创作流程，提高了制作效率，降低了成本，同时提升了视频的整体质量和用户体验。其应用场景广泛，涵盖教育、医疗、文化旅游、金融管理和广电传媒等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 817 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 817 浏览

Futuretools工具

FutureTools收集并组织了所有最好的AI工具，所以你也可以成为超人！

Ai学习资源 2025年06月05日 34 点赞 0 评论 816 浏览

MiniMax 大语言模型

它基于海量中文数据训练而成，拥有超过1000亿个参数，能够处理上百TB的文本数据。

创作工具 2026年06月23日 0 点赞 0 评论 815 浏览

AI Transcribe

Transcribe 是一个基于 OpenAl 训练并开源的录音转文字工具，支持英语、中文等多种语言，最大的优点就是无需下载大型的模型文件。

Ai语音工具 2025年06月05日 76 点赞 0 评论 815 浏览

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型，能够处理文本和语音数据，支持跨模态学习。其基础版（BASE）和表达版（EXPRESSIVE）分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别（ASR）、文本到语音（TTS）、语音分类及情感分析等任务，在语音助手、语音转写、有声读物等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 815 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期