多语言支持

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

QuillWord

QuillWord 是一款专为学术和研究写作设计的AI工具,提供智能文本生成、语法检查、风格优化、大纲与摘要生成、邮件撰写及多种引用格式支持。具备文档编辑、多语言处理、云存储和协作功能,适用于论文撰写、研究报告、期刊投稿等场景,提升写作效率与专业性。

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。

Casibase

一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话场景。

Dubbing Studio

一个全自动化的AI配音或视频翻译工具,你只需要上传视频或者粘贴视频链接,AI Dubbing就能全自动的在几十秒到几分钟内将你的视频翻译成29种语言。

dots.llm1

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts(MoE)文本大模型,拥有 1420 亿参数,激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练,采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术,提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

Marco

Marco是一款由阿里国际研发的大规模商用翻译大模型,支持15种主流语种,具备基于语境的精准翻译能力。其核心功能包括多语种翻译支持、跨境电商优化、多样化风格翻译以及高并发处理能力。Marco采用深度学习技术,结合多语言数据筛选和参数扩展方法,确保翻译质量和效率。它广泛应用于商品信息本地化、多语言客户服务、跨境电商平台及个人文档翻译等领域,助力全球化沟通。

SurveyGO卷姬

SurveyGO是一款由清华大学与面壁智能团队联合开发的开源AI论文写作工具,支持根据用户输入的主题快速生成结构清晰、内容详实的综述文章。其核心技术LLMxMapReduce-V2利用文本卷积算法整合多篇文献,提升信息完整性与逻辑性。支持中英文双语输出,适用于科研、教学、行业分析等多种场景,显著提升文献综述的写作效率与质量。

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。

Exemplary AI

Exemplary AI是一款基于AI技术的内容处理工具,可将长视频和音频转换为短视频片段、文字记录及摘要等形式,同时支持多语言字幕生成和社交媒体优化。其主要功能包括视频剪辑、文本记录、AI写作、多语言支持等,广泛应用于社交媒体营销、教育培训、企业培训等领域,助力用户高效创作并传播优质内容。