语言支持

Narakeet

Narakeet 是一款基于自然语音合成技术的在线工具,支持将文本、文档和字幕转换为高质量音频并同步至视频。提供 100 多种语言和 800 多种声音,支持自动化视频制作和多平台分发,适用于教育培训、市场营销、企业沟通及个人创作等多种用途。

X

X-Me通过其先进的AI技术,为用户提供了一个简单易用的平台,可以快速生成个性化的AI虚拟形象视频。

华为小艺

华为小艺是华为推出的一款AI助手,支持网页端访问,具备AI问答、写作、编程辅助、翻译及联网搜索等功能。其接入DeepSeek-R1智能体,支持实时信息检索,提升交互精准度。用户可通过语音或文本与小艺互动,适用于知识查询、多语言沟通、内容创作等场景,支持深度思考模式,满足多样化的使用需求。

PageOn.ai

PageOn.ai是一个AI驱动的内容创作平台,帮助用户快速生成高质量的视觉内容。通过AI Agent理解用户需求,自动生成动态视觉元素,如互动图表、3D模型和媒体内容。用户只需描述外观和感觉,AI即可转化为视觉表达。平台具备深度搜索功能,支持拖放和斜杠命令组合内容,打造个性化视觉故事。主要功能包括AI生成幻灯片、智能演示、数据图表生成、实时语音交互和多人协作等,适用于教学演示、商务会议、项目汇报

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型,由趣丸科技与香港中文大学(深圳)联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异,可快速精准地克隆音色并灵活调整语音属性,适用于多种语言,已开源并面向全球用户开放。

Pidgeon

Pidgeon是一款利用人工智能技术的新闻聚合应用,主要功能包括生成简洁的新闻摘要、整合全球新闻资源、支持多语言及个性化定制。用户可通过智能分类筛选新闻内容,并享受无广告干扰的阅读体验。此外,Pidgeon还提供离线阅读和多模式切换功能,适用于快速获取全球资讯的用户。

Fish Agent

Fish Agent是一款集成了自动语音识别(ASR)与文本到语音(TTS)技术的端到端语音处理工具,能够直接实现语音到语音的转换,无需传统语义编码器/解码器。它支持多种语言,适用于语音转换、环境音频信息捕捉等场景,并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。

DeepTutor

DeepTutor 是一款基于人工智能的智能辅导系统,支持文本、图表、公式等多种内容的深度理解与解析。用户可上传 PDF 文档并选择不同模式进行提问,系统提供上下文相关的详细解答,并具备视觉内容解读、学习进度跟踪等功能。适用于学生学习、文献分析、知识图谱构建等场景,支持多语言界面,提升学习与研究效率。

Universal

Universal-1是一款由AssemblyAI开发的多语言语音识别和转录模型,经过大量多语种音频数据训练,支持英语、西班牙语、法语和德语等。该模型在各种复杂环境中提供高精度的语音转文字服务,具备快速响应能力和改进的时间戳准确性。Universal-1在准确率、响应时间、时间戳估计和用户偏好等方面表现优异,适用于对话智能平台、AI记事本、创作者工具和远程医疗平台等多个应用场景。

Command A

Command A 是 Cohere 推出的企业级生成式 AI 模型,具备高性能和低硬件需求,支持 256k 上下文长度及 23 种语言。集成 RAG 技术,提升信息准确性。适用于文档分析、多语言处理、智能客服和数据分析等场景,适合企业部署使用。