音频

FakeYou

FakeYou是一个多功能的AI声音生成平台,它通过模拟名人声音,为用户提供了一个创意无限的声音创作工具。

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型,支持图像、音频和文本的综合处理,具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能,尤其擅长场景理解、OCR识别及语言生成等任务,同时通过智能WebSearch调用增强问题解答能力,适用于个人助理、智能家居、车载系统等多种应用场景。

Video Candy

一款在线视频编辑器,Video Candy提供一系列用于编辑和增强视频的工具,界面友好、100%免费使用,无需帐户,可以直接通过网络浏览器访问使用。

万彩录课大师

一款免费的PPT微课录制工具,万彩录课大师集PPT录制、真人录音、虚拟人物讲解与后期编辑于一体,专注于各种PPT课件课程的录制和编辑。

Endel.io

可帮助您集中注意力、放松身心和入睡。以神经科学为后盾。

SenseVoice

一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型,SenseVoice具有多语种、混合语言、音色和情感控制能力。

声咖

只需导入文本或上传已录制的音频,选择音色,即可生成高品质的小说配音音频内容。

AIShowX

AIShowX是一款多功能AI工具平台,支持文本转视频、图片转视频、视频增强、图像生成与风格转换等功能。用户可通过简单操作生成高质量视频和图像,适用于创作、影视、营销、教育及社交等多个领域。平台提供图像锐化、动画添加及音频处理等辅助功能,提升内容表现力与专业度。

Alphy

一个由AI驱动提供在线和本地音频内容的转录、摘要和问答服务的平台,包括YouTube视频。Alphy帮助用户快速高效地从音频和音频视听媒体中提取有价值的信息。