图像 - 智狐AI导航

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 842 浏览

Pikaso

Pikaso，免费的在线实时涂鸦出图工具，用户只需快速绘制草图即可创建他们能想象到的任何图像。它不仅仅是一个人工智能工具，它是你创意本质的延伸。

Ai绘画生成 2025年06月05日 100 点赞 0 评论 842 浏览

LightLab

LightLab是一款基于扩散模型的图像光源控制工具，支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练，该工具能生成逼真的光照效果，如阴影和反射。其交互式界面使用户能够直观地进行光照编辑，适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

AI项目与工具 2025年06月11日 34 点赞 0 评论 842 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 842 浏览

TouchRetouch

TouchRetouch是一款专业的图像编辑软件，专注于去除照片中的多余物体或瑕疵。其核心功能包括对象感知修饰、灵活的线条移除以及智能网格移除，能够高效处理各种复杂的编辑需求。该软件界面友好，操作简便，广泛适用于照片修复、产品摄影、旅行摄影等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 842 浏览

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型，专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题，并支持以即插即用的形式融入现有扩散模型，无需重新训练即可实现高效的空间控制。

AI项目与工具 2025年06月12日 24 点赞 0 评论 843 浏览

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型，由清华大学与智谱AI联合研发。它通过分阶段生成图像，从低分辨率逐步提升至高分辨率，提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL，在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术，适用于艺术创作、数字娱乐、广告营销等多个领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 843 浏览