音频 - 智狐AI导航

LANDR

LANDR是一款基于人工智能的音乐制作平台，提供从创作到分发的一站式解决方案。它通过AI母带处理优化音质，利用协作平台促进团队合作，借助样本库和插件丰富创作资源，并通过分发网络将作品推向全球市场。此外，LANDR还推出了“公平贸易AI”计划，支持艺术家参与工具开发并分享收益。

AI项目与工具 2025年06月12日 40 点赞 0 评论 487 浏览

TANGO

TANGO是一个开源框架，利用分层音频运动嵌入和扩散插值网络，生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持，适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题，并有效提升了视频内容制作效率。

AI项目与工具 2025年06月12日 78 点赞 0 评论 651 浏览

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI项目与工具 2025年06月12日 80 点赞 0 评论 560 浏览

SongDonkey

SongDonkey是一款基于AI技术的音频处理工具，能够高效分离人声与乐器音轨，支持多种格式输出和预览功能。它适用于音乐制作、教学、分析及编辑等领域，为用户提供便捷的音频处理体验。

AI项目与工具 2025年06月12日 57 点赞 0 评论 707 浏览

PodLM

PodLM是一款利用先进AI技术打造的播客生成工具，能够将网页内容、文本或文档快速转化为高质量的播客节目。其主要功能包括自动脚本生成、一键式网页转播客、文本转播客以及多样化的AI语音定制选项。PodLM还支持多角色语音合成及背景音乐集成，适用于个人创作者、教育机构、新闻媒体和企业等多个领域，显著提升了内容传播效率。

AI项目与工具 2025年06月12日 61 点赞 0 评论 1667 浏览

Podcastle

Podcastle是一款以AI为核心的播客制作平台，集成了录音室、音频与视频编辑器及AI生成的声音工具，支持本地多人协作录音、降噪处理、品牌定制化功能及声音克隆技术。该平台覆盖从创意到发布的全链条服务，并支持内容托管与多平台分发，适用于个人播客、远程采访、教育培训、企业沟通及有声读物制作等多种场景。

AI项目与工具 2025年06月12日 31 点赞 0 评论 857 浏览

screenpipe

ScreenPipe是一款基于AI技术的开源软件，具备全天候屏幕和音频记录功能，能够智能生成每日工作摘要、会议纪要，并监控安全风险。它支持本地处理，确保数据安全，同时提供插件系统以满足个性化需求。ScreenPipe适用于个人效率提升、企业自动化、安全监控、内容创作、教育培训及客户服务等多个场景。

AI项目与工具 2025年06月12日 44 点赞 0 评论 704 浏览

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具，可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并，还具备强大的文本转语音功能，允许用户选择不同的语音模型来优化音频效果。此外，其开源特性便于开发者根据需求进行个性化定制，广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 789 浏览

Open NotebookLM

Open NotebookLM是一个开源工具，能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型，生成自然流畅的对话式音频，并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件，适用于教育、科研、商业分析等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 852 浏览

Transkriptor

Transkriptor是一款基于AI技术的在线音频和视频转录工具，支持100多种语言，兼容多种文件格式。它提供包括转录、翻译、编辑、多格式导出及AI聊天助手在内的全面功能，旨在满足用户对语音数据处理的需求。其应用场景广泛，如会议记录、教育、法律记录等，可大幅提升工作效率和准确性。

AI项目与工具 2025年06月12日 21 点赞 0 评论 938 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期