语言支持

谛韵DiffRhythm

DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具,可根据文本生成Live2D格式的2D卡通角色,具备文本解析、外观生成、动画增强等功能。支持多语言输入,适用于游戏、影视、教育等多个场景,提升角色设计效率与表现力。

Hika

Hika 是一款由国内团队开发的免费 AI 知识搜索工具,通过交互式探索、可视化知识映射和多维度信息整合,帮助用户深入理解复杂主题。支持多语言、实时数据更新及个性化知识图谱,适用于学术研究、信息分析和个人知识管理等场景。

中科相生 – 数字克隆人

中科相生作为一个数字克隆人生产力工具,通过其先进的AI技术和用户友好的界面,为用户提供了一个高效、个性化的视频制作平台。

琅琅配音

琅琅配音是一款卓越的智能文本转语音工具,提供语音合成服务。

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架,能够将静态照片转化为高质量动态视频。其核心在于混合引导机制,结合隐式面部表示、3D头球和身体骨架,实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配,适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域,具备高保真、强连贯性和广泛适用性。

Actor Mode

Actor Mode 是由 ElevenLabs 开发的 AI 语音生成工具,支持用户通过自身声音生成风格一致的语音内容。它具备多语言支持、语音属性调节、即时生成等功能,适用于有声读物、视频配音、虚拟助手等多个领域。用户可通过录制或上传音频,让 AI 提取语音特征并生成符合要求的语音输出,提高创作效率与个性化表达。

OpenL

OpenL 是一个功能强大的 AI 驱动翻译工具,它利用最新的人工智能技术为用户提供快速、准确的翻译服务。

Prompt Perfect

一个提示词优化工具,旨在提升大型语言模型和大型模型结果的质量,PromptPerfect 是提示词工程师、内容创建者和 AI 开发人员的理想之选,是您轻松高效地进行提示开发的通行证。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。