音频

Memo AI

Memo AI 是一款AI 驱动的视频、播客转文字工具。

智能翻译官

AI智能翻译引擎,涵盖文本、文档、图片、视频、音频等多种在线翻译模式,更有强大的文档格式转换处理功能,为您节约80%的时间。

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

MyEdit

一款在线图片编辑和音频剪辑工具,用户可以使用AI照片编辑器来增强照片、去除人物和文字,甚至生成图像和场景。还提供强大的音频编辑工具,包括文本转语音、语音转文本和背景噪音去除功能。

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

Jukebox

OpenAI开发的AI音乐生成器,Jukebox能够根据提供的歌词、艺术家和流派信息生成多种流派和艺术家风格的完整音乐和人声歌曲。

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。

视频编辑王

一键剪切/合并/裁剪/分割/旋转,快速添加字幕/音乐/配音/特效

Covers AI

一款功能强大的AI声音和歌曲生成器工具,允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。

Huxe AI

Huxe AI是一款基于生成式AI技术的个人音频伴侣应用,旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流,Huxe AI能够生成定制化的语音内容,帮助用户高效管理日程、获取信息并提升学习效率。