语音 - 智狐AI导航

Media2Face

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

Ai开源项目 2025年06月05日 56 点赞 0 评论 970 浏览

Microsoft Dragon Copilot

Microsoft Dragon Copilot 是一款专为医疗行业设计的AI语音助手，结合语音识别与环境感知技术，支持多语言语音输入、自动化任务处理、信息检索等功能。旨在提升临床文档效率、减轻医护人员负担，并优化医疗服务流程。适用于医生、护士、行政人员及其他医疗团队成员，提升工作效率与患者体验。

AI项目与工具 2025年06月12日 57 点赞 0 评论 970 浏览

byword

Byword是一款基于人工智能技术的写作工具，能够高效生成高质量、SEO优化的文章。它支持批量生成内容、关键词提取、标题生成、图片匹配及多语言支持等功能，并与主流平台无缝集成，极大简化了内容创作和发布流程。无论是企业还是个人用户，均可借助Byword提升内容生产力并优化搜索引擎排名。

AI项目与工具 2025年06月12日 19 点赞 0 评论 973 浏览

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量，并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术，适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 974 浏览

BILIVE

BILIVE 是一款面向 B 站直播的 AI 工具，支持自动录制、弹幕渲染、语音识别、片段切片、封面生成及自动投稿。兼容低配置设备，无需 GPU，适合个人及小型团队使用，提升直播内容制作效率。

AI项目与工具 2025年06月11日 33 点赞 0 评论 1013 浏览

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音（TTS）模型，能够模仿特定说话者的风格，生成高质量、自然的语音。该模型采用轻量级设计，包括文本编码器、解码器和音频编解码器，通过整合文本描述和嵌入层，优化了语音生成过程。Parler-TTS的所有资源公开，促进了高质量、可控TTS模型的发展。此外，用户还可以根据需要对模型进行自定义训练和微调。

AI项目与工具 2024年01月01日 91 点赞 0 评论 1089 浏览

Rask Ai

Rask AI是新一代的视频翻译和配音工具，是一个利用先进的人工智能技术来自动化视频内容本地化和翻译过程的平台。

Ai语音工具 2025年06月05日 74 点赞 0 评论 1125 浏览

Krillin AI

一款本地的视频翻译、配音和语音克隆的工具，适用于哔哩哔哩、小红书、抖音、视频号、快手、YouTube、TikTok等主流平台。

Ai语音工具 2025年06月05日 91 点赞 0 评论 1287 浏览

小布助手

小布助手是OPPO推出的智能语音助手，支持语音交互、联网搜索、深度思考和多格式导出等功能。其网页版接入DeepSeek-R1技术，提升信息处理能力，适合日常查询、学习辅助及工作场景。支持多语言模式、语音风格选择及自定义唤醒词，满足个性化需求，适用于手机与网页端无缝衔接的使用体验。

AI项目与工具 2025年06月11日 30 点赞 0 评论 1551 浏览

PodLM

PodLM是一款利用先进AI技术打造的播客生成工具，能够将网页内容、文本或文档快速转化为高质量的播客节目。其主要功能包括自动脚本生成、一键式网页转播客、文本转播客以及多样化的AI语音定制选项。PodLM还支持多角色语音合成及背景音乐集成，适用于个人创作者、教育机构、新闻媒体和企业等多个领域，显著提升了内容传播效率。

AI项目与工具 2025年06月12日 61 点赞 0 评论 1667 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期