图像 - 智狐AI导航

RAG

RAG-Diffusion是一种区域感知型文本到图像生成工具，采用区域硬绑定与区域软细化两阶段策略，实现对图像区域的精确控制与细节优化。该工具支持图像重绘，无需额外内绘模型，且具备免微调特性。其主要应用场景包括数字艺术创作、广告设计、游戏开发及影视制作等领域，能够显著提升工作效率并满足个性化需求。

AI项目与工具 2025年06月12日 48 点赞 0 评论 493 浏览

HandRefiner

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

Ai开源项目 2025年06月05日 27 点赞 0 评论 493 浏览

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术，通过自动生成数据集并微调模型，支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集，实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 491 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 491 浏览