语音

Revid AI

Revid AI 是一款AI驱动的视频生成工具,支持从脚本创作到视频发布的全流程操作。用户可输入创意自动生成视频内容,涵盖多种风格与语言模板,具备简单易用的编辑功能及一键发布能力。适用于社交媒体、品牌营销、教育分享及电商展示等多个场景,提升内容创作效率与传播效果。

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具,结合专业口音课程与AI语音分析技术,帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议,并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能,适用于职场、考试、日常交流及表演等领域,有效提升英语口语能力。

Mahilo

Mahilo 是一款支持多智能体协作的框架,具备实时语音与文本通信能力,支持智能体间共享上下文并接受人类监督。其提供灵活的通信模式和策略管理功能,适用于客户服务、紧急响应、内容创作、医疗协调等多个场景。通过标准化的消息协议和可扩展的架构,Mahilo 提升了人机协作效率与决策质量。

白瓜面试

白瓜面试是一款集智能回答、代码解析、语音与图像识别于一体的AI面试辅助工具。它通过实时语音转录、图片分析及物理隔离功能,帮助求职者在技术面试和技术岗位应聘中保持高效表现。此外,它还支持在线面试、笔试优化及简历定制服务,旨在全面提升用户的面试体验。

CosyVoice 2.0

CosyVoice 2.0是一款基于深度学习的语音生成大模型,通过有限标量量化技术和新型架构设计,在发音准确性、音色一致性和韵律表达方面表现出色。其支持流式推理,延迟低至150ms,广泛应用于智能助手、有声读物、视频配音及语言学习等领域,同时具备多语言支持和情感控制等功能。

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

​33搜帧

​33搜帧是一个可以通过文本描述来搜索视频画面的工具

MagicMic

MagicMic是一个功能强大的声音变换工具,适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效,以及实时声音变换技术,使用户能够在游戏中或在线聊天中保护隐私...