Glimmer AI 一款使用GPT-3和DALL·E 2进行AI支持的ppt演示工具,根据用户的文本和语音指令生成视觉非常出色的PPT演示文稿。 PPT资源 2025年06月05日 96 点赞 0 评论 701 浏览
Soundverse AI 一个利用生成式人工智能的音乐创作平台,Soundverse AI提供免费的 AI 音乐生成器和语音助手,帮助音乐创作者轻松制作高质量的音乐。 Ai语音工具 2025年06月05日 80 点赞 0 评论 701 浏览
SpeechEasy SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单... Ai语音工具 2026年06月24日 0 点赞 0 评论 702 浏览
Westlake Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型,融合了语音识别、自然语言处理、情感理解和对话管理等功能,具备实时性和端到端交互特性。它通过深度学习技术和离散表示法,实现从语音输入到语音输出的全流程自动化,生成自然流畅的语音回应,并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。 AI项目与工具 2025年06月12日 91 点赞 0 评论 702 浏览
SlideSpeak SlideSpeak是一款基于AI技术的多功能工具,支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外,SlideSpeak强调数据安全性,适用于学术研究、商业演示、教育培训等多个领域。 AI项目与工具 2025年06月12日 11 点赞 0 评论 703 浏览
FunAudioLLM FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。 AI项目与工具 2025年06月12日 66 点赞 0 评论 703 浏览
GTSinger GTSinger是一项由浙江大学研发的开源高质量歌声数据集,包含80.59小时的多语言专业录音棚歌声数据,支持歌声合成、技巧识别、风格迁移和语音到歌声转换等多种任务。它通过音素级标注和真实乐谱支持,为歌唱技巧的研究和应用提供了强大工具。 AI项目与工具 2025年06月12日 77 点赞 0 评论 703 浏览
DeepL DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务,可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译 Ai语音工具 2026年06月24日 0 点赞 0 评论 704 浏览
Llasa TTS Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。 AI项目与工具 2025年06月12日 71 点赞 0 评论 704 浏览