音频 - 智狐AI导航

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型，特别适用于大语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文，英文也能 hold 住...

创作工具 2026年06月23日 0 点赞 0 评论 657 浏览

UniFab

一款功能强大的视频增强工具，UniFab具有AI驱动的升频、降噪、SDR 到 HDR 转换以及其他多种功能，提升视频质量，满足专业人士和爱好者的需求。

视频剪辑 2025年06月05日 21 点赞 0 评论 656 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 656 浏览

逗哥配音神器

逗哥配音神器是一个功能全面的在线配音平台，提供了从文案输入到配音生成、下载及字幕制作的一站式服务。

创作工具 2026年06月23日 0 点赞 0 评论 651 浏览

TANGO

TANGO是一个开源框架，利用分层音频运动嵌入和扩散插值网络，生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持，适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题，并有效提升了视频内容制作效率。

AI项目与工具 2025年06月12日 78 点赞 0 评论 651 浏览