语音

SenseVoice

一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型,SenseVoice具有多语种、混合语言、音色和情感控制能力。

知意配音

知意配音是一款利用AI技术的文字转语音工具,支持多平台操作,拥有超过200种声音选项,可满足多种配音需求。它具备多音字识别、文案提取、视频字幕编辑等功能,适用于小说推文、影视解说、广告制作等多个领域,是自媒体创作者和视频制作者的理想助手。

Vizard录屏

免费高清的在线电脑录屏、剪辑软件,无需下载安装软件。

Fineshare VoiceTrans

Fineshare VoiceTrans 是一款支持实时变声的 AI 工具,可将声音转换为多种角色或性别,保留原有情感与语调。提供丰富的音效库、声音实验室和预设声音包,适用于游戏、直播、配音等场景。用户可通过不同订阅计划获得无限使用权限和定制服务,提升创作与互动体验。

MeloTTS

MeloTTS是一个高质量的多语言文本转语音(TTS)库,由MyShell AI开发。该工具支持多种语言的文本转语音任务,包括英语(含不同口音)、西班牙语、法语、中文、日语和韩语,并具备快速的语音合成速度。MeloTTS不仅支持中英混合发音,还易于安装和使用,适用于多种操作系统和环境。用户可以在GitHub和Hugging Face平台上获取和体验MeloTTS。

芊芊妙音

芊芊妙音是一款基于AI技术的配音与变声工具,拥有丰富的音色库及强大的音频处理能力。它支持文字提取、语音转文字、音频编辑等功能,可广泛应用于社交媒体内容创作、视频制作、语言学习等领域。用户可以通过该软件实现个性化声音定制,并轻松分享作品至各大社交平台。

星声AI

星声AI是一款智能化播客生成工具,支持文字、网页链接或文档输入,自动生成结构完整的播客脚本,并通过高质量语音合成技术转化为自然流畅的音频内容。平台支持中、英、日、韩四国语言,提供多种音色与风格选择,具备音频编辑、内容拆解、多平台发布等功能,适用于知识分享、企业培训、内容创作等多种场景。

LiveKit Agents

LiveKit Agents 是一款基于 Python 的多模态 AI 工具框架,支持实时语音、视频和数据交互。其核心功能包括基于 WebRTC 的低延迟通信、与 OpenAI 等服务的深度集成、丰富的插件生态系统以及负载均衡与自动扩展能力。适用于虚拟助手、客户服务、实时翻译、视频内容审核等多个应用场景。

Tactiq.io

一个为各种在线会议平台(例如 Google Meet、Zoom 和 MS Teams)提供实时转录服务的平台。Tactiq.io提供实时转录、人工智能生成的会议摘要、行动项目以及提出自定义问题的功能等功能。

FakeYou

FakeYou是一个多功能的AI声音生成平台,它通过模拟名人声音,为用户提供了一个创意无限的声音创作工具。