Orpheus TTS Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统,支持自然、富有情感的语音生成。具备零样本语音克隆能力,无需预训练即可模仿特定语音,延迟低至 200 毫秒,适合实时应用。支持多种语音风格和情感控制,适用于有声读物、虚拟助手、游戏、教育等多个领域。 AI项目与工具 2025年06月12日 26 点赞 0 评论 577 浏览
ViiTor AI ViiTor AI是一款基于人工智能技术的创新平台,集成了视频翻译、语音克隆、动态语音合成等功能,支持多语言处理。它能够将静态内容转化为动态形式,同时实现跨语言交流,适用于个人创作者、教育机构、跨国企业和翻译行业,帮助企业提升全球化竞争力。 AI项目与工具 2025年06月12日 86 点赞 0 评论 578 浏览
Voice Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能,支持超过100种语言,广泛应用于教育、娱乐和商业领域,显著提升音频处理效率和便捷性。 AI项目与工具 2025年06月12日 33 点赞 0 评论 578 浏览
SOLAMI SOLAMI是一款基于VR环境的3D角色扮演AI系统,支持用户通过语音和肢体语言与虚拟角色进行沉浸式互动。系统采用社交视觉-语言-行为模型(Social VLA),可识别用户的多模态输入并生成相应响应,涵盖多种角色类型及互动场景,如游戏、舞蹈等。其核心技术涉及多任务预训练和指令微调,适用于虚拟社交、教育、心理治疗及娱乐等多个领域。 AI项目与工具 2025年06月12日 66 点赞 0 评论 578 浏览
蓝藻AI 运用了尖端的创造性人工智能技术,致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。 创作工具 1970年01月01日 0 点赞 0 评论 579 浏览
MiniCPM MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 579 浏览
cnChar 一个功能全面、多端支持的汉字拼音笔画JavaScript库,用于处理汉字相关的多种功能,包括拼音、笔画、简繁体转换等。 字体字库 2025年06月05日 95 点赞 0 评论 580 浏览
Podcastfy Podcastfy 是一款基于生成式人工智能技术开发的开源工具,可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并,还具备强大的文本转语音功能,允许用户选择不同的语音模型来优化音频效果。此外,其开源特性便于开发者根据需求进行个性化定制,广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。 AI项目与工具 2025年06月12日 18 点赞 0 评论 580 浏览
Glimmer AI 一款使用GPT-3和DALL·E 2进行AI支持的ppt演示工具,根据用户的文本和语音指令生成视觉非常出色的PPT演示文稿。 PPT资源 2025年06月05日 96 点赞 0 评论 580 浏览
voice.ai voice.ai的使命是通过普及人工智能技术,增强协作创造力,并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。 创作工具 1970年01月01日 0 点赞 0 评论 580 浏览