模型 - 智狐AI导航

TokenFlow

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

Ai开源项目 2025年06月05日 25 点赞 0 评论 513 浏览

CreatiLayout

CreatiLayout 是一种先进的布局到图像生成技术，由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM，结合 SiamLayout 框架和 MM-DiT 架构，实现高质量、细粒度可控的图像生成。同时，其 LayoutDesigner 工具支持多种输入方式，帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 513 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 513 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 513 浏览

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架，通过多视图扩散模型和视图筛选机制生成高质量3D模型，支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型（FlexRM），结合三平面表示与3D高斯绘制技术，实现高效且详细的三维重建，广泛应用于游戏开发、AR/VR、影视制作等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 513 浏览

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型，用于识别相机陷阱图像中的动物物种，支持超过 2000 种标签分类，涵盖动物、分类群及非生物对象。基于 6500 万张图像训练，具备高效数据处理和跨场景识别能力，适用于野生动物监测、生物多样性研究及生态保护。模型开源，可在 GitHub 获取，支持开发人员部署与优化。

AI项目与工具 2025年06月12日 39 点赞 0 评论 514 浏览

AingDesk

AingDesk 是一款开源的 AI 模型部署工具，支持一键安装上百款 AI 模型，降低使用门槛。具备联网搜索功能，提升回答准确性；提供模型共享与多语言支持，便于团队协作与跨语言使用。内置模型管理器，优化本地资源利用，适用于学习、办公及学术研究等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 515 浏览

SaRA

SaRA是一种新型预训练扩散模型微调方法，通过重新激活预训练阶段未被充分使用的参数，有效提升模型的适应性和泛化能力。该方法支持核范数低秩稀疏训练，能够防止过拟合并优化模型性能，同时大幅降低计算资源需求。SaRA适用于多种应用场景，包括图像风格迁移、视频生成及下游数据集微调等，仅需少量代码调整即可实现高效微调。

AI项目与工具 2025年06月12日 12 点赞 0 评论 515 浏览

Stability AI开源Stable Diffusion 3 Medium文生图模型

Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型，拥有20亿个参数，适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力，以及高资源效率。此外，它还支持API试用，并得到了NVIDIA和AMD的支持，以优化其性能。Stability AI致力于开放和安全的AI应用，并计划持续改进SD3 Medium。

AI项目与工具 2024年01月01日 67 点赞 0 评论 515 浏览

Uthana

Uthana是一款基于AI的3D角色动画生成平台，支持通过文字描述、参考视频或动作库快速生成逼真动画。其核心功能包括动作搜索、骨骼适配、风格迁移、API集成等，适用于游戏开发、影视制作、虚拟角色设计等多个领域。平台提供灵活的输出格式和编辑工具，帮助用户高效完成动画创作。

AI项目与工具 2025年06月12日 62 点赞 0 评论 515 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期