多语言 - 智狐AI导航

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 700 浏览

Heeyo

Heeyo是一款面向3至11岁儿童的智能AI学习伙伴，提供超过2000种互动学习游戏，涵盖阅读、科学、智力问答等领域。这款AI学习伙伴支持20种语言，由顶尖教育机构训练，确保安全和有趣的学习体验。Heeyo能够根据孩子的年龄和兴趣个性化推荐学习内容，孩子们还可以设计自己的AI伙伴，享受定制化的学习体验。Heeyo承诺100%无广告，严格遵守COPPA儿童隐私保护法，让家长能够监控孩子的学习进度。

AI项目与工具 2025年06月12日 82 点赞 0 评论 499 浏览

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序，集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型，它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译，适用于多语言环境。通过集成OCR技术，它能够生成图文并茂的多媒体记录，显著提高工作效率。

AI项目与工具 2025年06月12日 52 点赞 0 评论 499 浏览

Sync Labs

Sync Labs是一款基于AI技术的视频配音工具，其主要功能是实现实时唇形同步，支持多种语言。该工具无需用户进行额外的训练，通过简单的界面操作即可实现音频与视频的完美匹配。它适用于电影、播客、游戏和广告等多种视频内容制作，同时提供了开放API，方便集成到各类应用和服务中。

AI项目与工具 2025年06月12日 96 点赞 0 评论 506 浏览

Mureka是一款由昆仑万维开发的AI音乐创作平台，旨在为专业艺术家和音乐爱好者提供高效、稳定的音乐创作环境。用户可以输入歌词并添加参考音乐，通过平台提供的Style功能控制音乐风格，实现个性化音乐创作。平台支持音乐风格和旋律控制，以及对歌曲各部分的自由调整，如前奏、主歌、副歌等。生成的音乐具有高度稳定性和可控性，用户可将其展示和销售，获得经济收益。Mureka还支持多语言音乐创作，涵盖多种语言，

AI项目与工具 2025年06月12日 74 点赞 0 评论 861 浏览

Melodio

Melodio是一款由昆仑万维开发的AI流媒体音乐应用程序，能够根据用户输入的提示实时生成个性化音乐。该应用程序支持多种语言，包括中文，并提供无限流式播放功能。用户可以在音乐播放过程中随时调整提示，享受连续不断的音乐体验。此外，Melodio还具有歌词查询、音乐保存和分享功能。其主要功能包括AI音乐生成、多语言支持、无限流式播放、实时音乐定制以及歌词查询和显示。

AI项目与工具 2025年06月12日 96 点赞 0 评论 909 浏览

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具，支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能，支持多种格式导出，并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 511 浏览

Subtitle Edit

Subtitle Edit 是一款免费开源的多功能字幕编辑器，支持超过300种字幕格式。它具备字幕同步、创建、翻译、音频波形可视化、视频播放、AI语音识别、AI自动翻译和OCR技术等功能，适用于影视后期、多语言内容创作、教育培训及辅助听力障碍者等场景。其界面友好，操作简便。

AI项目与工具 2025年06月12日 61 点赞 0 评论 774 浏览

Glyph

Glyph-ByT5-v2是一个由多家知名学术机构合作开发的多语言视觉文本渲染工具。它支持10种不同语言的视觉文本渲染，通过构建包含大量字形-文本对和平面设计图像-文本对的数据集，结合先进的步骤感知偏好学习技术，显著提升了视觉文本的拼写准确性和审美质量。该工具适用于平面设计、广告制作、数字艺术、出版行业及品牌标识设计等多个领域。 ---

AI项目与工具 2025年06月12日 20 点赞 0 评论 812 浏览

SadTalker

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频，通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情，PoseVAE合成不同风格的头部运动，并采用3D面部渲染技术，实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力，适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

AI项目与工具 2025年06月12日 71 点赞 0 评论 713 浏览

多语言

首页

多语言

列表

默认

浏览次数

发布日期