语言支持

Casibase

一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话场景。

BlipCut

BlipCut是一款基于AI的视频处理工具,支持130多种语言的视频翻译、自动字幕生成、AI配音和唇形同步。用户可上传视频或链接,一键生成多语言版本,并支持语音克隆、智能剪辑及批量处理,适用于内容创作、教育、营销等场景。

yaara.ai

Yaara.ai是一款利用人工智能技术开发的内容创作平台,支持多语言环境,涵盖博客、社交媒体、营销材料及电商产品描述等多种应用场景。其主要功能包括AI辅助写作、多风格定制选项、Abracadabra模板库以及改写工具,旨在提升内容质量和创作速度,同时优化用户体验。

知渊AI

一款论文写作辅助神器,集论文选题生成、大纲生成、内容填充、文献引用、查重修改于一体的全方位论文写作辅助平台。

讯飞智能翻译

讯飞智能翻译是一款由讯飞开发的智能翻译工具,翻译结果具有高度的准确性和可靠性。

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成工具,支持 31 种语言和 248 种声音,能生成自然流畅的语音。具备多语言支持、自定义语音、流式合成等功能,适用于智能助手、有声读物、视频配音等场景。支持多种音频格式,注重数据安全与合规性。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型,支持多语言和多种音乐风格,如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案,解决长上下文处理与音乐生成难题,生成结构连贯、旋律优美的歌曲。模型完全开源,用户可自由使用和定制,适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

VERBALATE

VERBALATE是一款基于AI的视频翻译与配音工具,支持多语言翻译及口型同步,适用于教育、娱乐、企业培训等场景。其主要功能包括视频翻译、声音克隆、口型同步、多语言支持及长视频处理,界面友好且操作简便,为企业和个人用户提供高效的多语言内容解决方案。