框架 - 智狐AI导航

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架，支持多模态输入（如图片、文字、视频等）生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化，具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景，有效降低音乐创作门槛，提升创作效率与个性化体验。

AI项目与工具 2025年06月12日 77 点赞 0 评论 535 浏览

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架，通过过渡标记和局部注意力掩码策略，实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景，适用于影视、广告、教育、游戏等领域，具备高效、灵活和可扩展的技术特点。

AI项目与工具 2025年06月11日 73 点赞 0 评论 538 浏览

VARGPT

VARGPT是一款多模态大语言模型，整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制，支持文本与图像的混合输入和输出，具备高效的视觉生成能力。模型采用三阶段训练策略，提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 540 浏览

HaiSnap

一个适合小白用户快速开发简单应用的零代码开发平台。用户只需描述需求，即可生成应用并直接通过网页访问，无需部署。

Ai编程建站 2025年06月05日 10 点赞 0 评论 542 浏览

Deck of Brilliance

帮助创意专业人士产生点子

剧本文案 2025年06月05日 81 点赞 0 评论 547 浏览

Cooragent

Cooragent是清华大学LeapLab团队推出的开源AI Agent协作框架，支持通过自然语言快速创建Agent并实现多Agent协同。采用Prompt-Free设计，无需手动编写Prompt，系统自动优化功能。支持本地部署，保障数据安全，兼容Langchain工具链和MCP协议，提供全面API支持，适用于旅行规划、股票分析、文档处理等多种场景。

AI项目与工具 2025年06月11日 29 点赞 0 评论 551 浏览

书生·筑梦2.0

它不仅提供了更大的创作灵活性，还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架，为视频内容创作者提供了强大的工具，以创造更加生...

Ai平台模型 2026年06月23日 0 点赞 0 评论 557 浏览

LitServe

LitServe是一款基于FastAPI的高性能AI模型部署引擎，专为企业级AI服务设计。它支持批处理、流式处理和GPU自动扩展，简化了模型部署流程。LitServe易于安装和使用，提供灵活的API定义和强大的服务器控制能力。它兼容多种机器学习框架，具备自动扩展和身份验证等高级特性，适用于机器学习模型部署、大语言模型服务、视觉模型推理、音频和语音处理及自然语言处理等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 559 浏览

CodeFuse

CodeFuse-muAgent是由蚂蚁集团CodeFuse团队开发的一款多智能体框架，通过知识图谱引擎驱动智能体的编排和协作，简化复杂工作流程的自动化。它支持多种智能体类型，包括问答、工具使用和代码执行，并具备通信、记忆管理和自定义模型支持等功能，促进智能体间的高效协作。应用场景广泛，涵盖自动化办公流程、客户服务自动化、智能监控和安全、个性化推荐系统以及教育和培训等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 560 浏览

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 560 浏览

框架

首页

框架

列表

默认

浏览次数

发布日期