学习 - 智狐AI导航

AudioX

AudioX 是一种基于多模态输入的音频生成模型，支持文本、视频、图像等多种输入方式，能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略，提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力，适用于视频配乐、动画音效、音乐创作等多个场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 526 浏览

AudioStrip

AudioStrip 是一种使用AI和深度学习将人声从音频文件中的背景音乐分离出来的工具。

Ai语音工具 2025年06月05日 96 点赞 0 评论 526 浏览

Caricaturer

Caricaturer是一款利用深度学习技术的在线AI漫画头像生成工具，能将用户上传的照片转换为64种不同风格的漫画效果。它具备快速生成、高分辨率输出及隐私保护等特点，适用于个人娱乐、艺术创作、企业营销等多个场景。

AI项目与工具 2025年06月12日 75 点赞 0 评论 526 浏览

Infinity AI

Infinity AI是一款基于深度学习技术的人工智能工具，可将输入的剧本或对话内容转化为高质量视频。其核心功能包括生成式视频模型、数字人克隆技术和视频定制服务。用户可通过简单的操作实现一键视频生成，并利用AI克隆体制作个性化视频内容。这款工具广泛应用于教育、娱乐、新闻传媒、企业培训等场景，显著提升内容创作效率。

AI项目与工具 2025年06月12日 90 点赞 0 评论 525 浏览

Aligner

Aligner是由北京大学团队开发的大语言模型对齐工具，通过学习对齐答案与未对齐答案之间的差异来提升模型性能。采用自回归seq2seq结构，在Q-A-C数据集上训练，无需RLHF流程。具备高效、灵活、即插即用等特点，支持多模型兼容，提升模型帮助性和安全性。适用于多轮对话、价值观对齐及MoE架构优化等场景。

AI项目与工具 2025年06月12日 44 点赞 0 评论 525 浏览

Pika 2.2

Pika 2.2 是一款基于深度学习的AI视频生成工具，支持文本和图片输入，可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术（Pikaframes）和电影画幅比例支持，提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域，操作简便，适合各类用户快速生成创意视频。

AI项目与工具 2025年06月12日 34 点赞 0 评论 524 浏览