模型 - 智狐AI导航

AnimateDiff

AnimateDiff是一款由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员共同开发的框架，旨在将文本到图像模型扩展为动画生成器。该框架利用大规模视频数据集中的运动先验知识，允许用户通过文本描述生成动画序列，无需进行特定的模型调优。AnimateDiff支持多种领域的个性化模型，包括动漫、2D卡通、3D动画和现实摄影等，并且易于与现有模型集成，降低使用门槛。

AI项目与工具 2024年01月01日 59 点赞 0 评论 616 浏览

LabelLLM

一款开源免费的大模型对话标注平台

Ai平台模型 2026年06月24日 0 点赞 0 评论 615 浏览

LiveCC

LiveCC是一款由新加坡国立大学Show Lab与字节跳动联合开发的实时视频解说模型，基于自动语音识别字幕进行训练。它能够实时生成自然流畅的视频评论和回答相关问题，适用于体育、新闻、教育等多个场景。模型采用流式训练方法，结合大规模数据集和Qwen2-VL架构，具备低延迟和高质量的生成能力。LiveCC通过LiveSports-3K基准测试评估性能，广泛应用于视频内容分析与智能交互场景。

AI项目与工具 2025年06月11日 100 点赞 0 评论 615 浏览

TinyTroupe

TinyTroupe是一款基于大型语言模型的Python库，专注于生成逼真的虚拟人物行为。它通过构建虚拟角色（TinyPerson）与环境（TinyWorld），实现个性化、高自由度的行为模拟，并支持多智能体间的互动。该工具适用于市场研究、产品测试、用户体验优化等多个领域，为企业提供洞察力与决策支持。 ---

AI项目与工具 2025年06月12日 69 点赞 0 评论 615 浏览

RLCM

RLCM是由康奈尔大学开发的一种基于强化学习的文本到图像生成框架，通过微调一致性模型以适应特定任务的奖励函数，显著提升生成效率与图像质量。其核心技术包括强化学习、策略梯度优化及任务导向的奖励机制，适用于艺术创作、数据集扩展、图像修复等多个领域，具有高效的推理能力和对复杂任务的适应性。

AI项目与工具 2025年06月12日 69 点赞 0 评论 615 浏览

DreamOmni

DreamOmni是一款由香港中文大学、字节跳动与香港科技大学联合研发的统一图像生成与编辑模型。它集成了文本到图像生成（T2I）及多种编辑功能，包括指令式编辑、修复、拖拽编辑和参考图像生成。DreamOmni利用合成数据管道高效生成高质量编辑数据，并通过联合训练提升图像生成与编辑质量。该模型在多任务处理、复杂提示兼容性及训练效率优化上表现优异，适用于数字艺术、影视特效、广告设计等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 614 浏览

REEF

REEF是一种用于大型语言模型的指纹识别技术，通过在训练中嵌入编码信息生成唯一“指纹”，实现高精度、低开销的模型识别。具备鲁棒性、兼容性强等特点，适用于版权保护、模型溯源、非法行为打击等场景，广泛应用于学术、商业和监管领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 614 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 614 浏览

Red_Panda

Red_Panda 是一款由 Recraft AI 开发的先进 AI 图像生成工具，以其高精度的文本到图像转换能力和卓越的解剖学准确性著称。它能够生成复杂长文本对应的高质量图像，支持用户通过风格控制和图形设计工具实现个性化定制。此外，Red_Panda 还具备矢量图像生成能力，并集成 AI 图像编辑功能，广泛应用于设计、品牌营销、教育及出版等多个领域。

AI项目与工具 2024年11月01日 86 点赞 0 评论 614 浏览

画颜AI

画颜AI写真是一款利用人工智能技术的在线照相馆应用，用户可以上传自己的照片，应用将自动为用户生成具有艺术感的写真。

Ai图片处理 2025年06月05日 11 点赞 0 评论 614 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期