语音合成 - 智狐AI导航

呱呱有声-制作平台

呱呱有声制作平台通过其AI+制作模式，极大地提高了有声作品的制作效率和产能。无论是个人创作者还是专业团队，都可以利用该平台的先进功能，快速创作出高质量的有声作品，同时降低...

Ai语音工具 2026年06月23日 0 点赞 0 评论 544 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 548 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 551 浏览

MoonCast 是一个零样本播客生成系统，能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练，支持中文和英文，生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本，并利用语音合成模块转换为最终音频，具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强，适用于内容创作、教

AI项目与工具 2025年06月11日 63 点赞 0 评论 557 浏览

HIAIX导航

HIAIX，1500+AI全品类AI工具集，找AI工具,一个HIAIX导航网站就够了。

Ai学习资源 2025年06月05日 72 点赞 0 评论 559 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 560 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 561 浏览

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件，Memo都能轻松将其转换为文本并提炼精华。

Ai语音工具 2026年06月23日 0 点赞 0 评论 563 浏览

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口，具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动，并支持会话记忆和外部功能调用，广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 569 浏览

easegen

Easegen 是一款开源的 AI 工具，支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音，并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆，旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等，适用于在线教育、企业培训、学术研究、语言学习及职业培训

AI项目与工具 2025年06月12日 45 点赞 0 评论 570 浏览

语音合成

首页

语音合成

列表

默认

浏览次数

发布日期