多语言支持

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本，并支持多种语言。该工具具有多种音频和视频格式兼容性，提供不同的转录模型选择，支持字幕导出，且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速，提升了实时语音识别效率，并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

AI项目与工具 2025年06月12日 15 点赞 0 评论 861 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 861 浏览

BoomCut爆剪辑

小影科技旗下的 AI 内容创意产品与服务平台，提供一站式视频本地化解决方案，涵盖视频翻译、模特换脸、音色克隆等功能。

视频剪辑 2025年06月05日 11 点赞 0 评论 860 浏览

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具，支持自定义评分标准、抄袭检测及AI写作分析等功能，可快速生成客观一致的评分结果并提供个性化反馈，有助于提升评分效率、维护学术诚信及减轻教师工作压力。

AI项目与工具 2025年06月12日 52 点赞 0 评论 858 浏览

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具，支持多语言处理，利用先进的语音识别和翻译技术，实现视频内容的自动翻译，并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景，帮助内容创作者跨越语言障碍，扩大受众群体。

AI项目与工具 2025年06月12日 100 点赞 0 评论 857 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 854 浏览

字节跳动发布“豆包MarsCode”智能开发工具，面向国内开发者免费

豆包MarsCode是一款由字节跳动开发的免费AI编程工具，提供AI驱动的云端集成开发环境（IDE）和智能编程扩展。其主要功能包括代码补全、生成、优化、注释生成、代码解释和错误修复等。MarsCode支持云函数开发，集成API测试、存储和部署工具，并能自动生成JSON Schema。此外，MarsCode扩展支持多种编程语言和IDE，涵盖从代码编辑到单元测试生成的多个辅助功能，显著提升了编码效率和

AI项目与工具 2024年05月10日 41 点赞 0 评论 854 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 853 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 853 浏览

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具，提供超过500种真人音色和1000多种二次元音色，适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能，操作简便，适合各类内容创作者提升作品质量。

AI项目与工具 2025年06月12日 52 点赞 0 评论 853 浏览

多语言支持

首页

多语言支持

列表

默认

浏览次数

发布日期