语音

KAPWING

KAPWING是一款基于AI技术的在线视频编辑平台,提供从视频生成到编辑的一站式解决方案。其核心功能涵盖AI视频生成器、文档转视频、文本转语音、字幕生成及高级编辑工具,支持用户轻松创建和定制视频内容。此外,KAPWING还具备团队协作能力,适合教育、企业宣传及内容创作等多个应用场景。

Magic Data

Magic Data专注于为不同行业的AI模型提供高质量的训练和测试数据,以提升模型的性能和智能。

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。

Suno AI

Suno AI 是由 Anthropic 公司开发的一款 AI 音乐和语音生成工具。 仅使用文本提示即可生成高质量的歌声、乐器和完整的音乐作品。

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架,专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力,可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域,同时支持预训练模型微调和端到端开发流程,为企业提供高效灵活的解决方案。

Emote

Emote是一款基于AI技术的智能笔记工具,支持实时语音转录、情感分析及关键词提取等功能。它能帮助用户记录生活、管理时间、分析消费习惯,并提供私人笔友服务以实现情感支持。同时,Emote允许用户自定义笔记本和标签,满足个性化需求。

Vidnoz

Vidnoz是一款基于AI的在线视频生成工具,拥有超过1200个逼真的虚拟形象、470多种语言支持及900多个视频模板,支持从文本到视频的全流程制作。其主要功能包括AI虚拟形象生成、文字转语音、视频模板应用、智能编辑、语音克隆以及静态图片动态化处理,广泛应用于社交媒体营销、在线教育、企业培训、产品宣传等领域。

Copilot Vision

Copilot Vision是一款由微软开发的人工智能辅助工具,专为Microsoft Edge浏览器设计,处于预览阶段。它能够理解网页内容,通过语音交互为用户提供实时分析和见解,帮助用户进行活动规划、购物决策和学习辅助,同时确保用户隐私安全。

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜,木言AI是新自媒体人必不可少的工具!

ViiTor AI

ViiTor AI是一款基于人工智能技术的创新平台,集成了视频翻译、语音克隆、动态语音合成等功能,支持多语言处理。它能够将静态内容转化为动态形式,同时实现跨语言交流,适用于个人创作者、教育机构、跨国企业和翻译行业,帮助企业提升全球化竞争力。