图像生成 - 智狐AI导航

MUMU

MUMU是一种多模态图像生成模型，通过结合文本提示和参考图像来生成目标图像，提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet，并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力，同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

AI项目与工具 2025年06月12日 58 点赞 0 评论 593 浏览

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 592 浏览

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型，结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式，包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成，并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出，适用于艺术创作、内容营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 591 浏览

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型，能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略，显著提升了模型在视觉理解与图像生成上的表现，广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 591 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 590 浏览

aoGen

aoGen 是一款面向电商行业的 AI 图像生成工具，可快速生成多种风格的虚拟模特并实现服装适配，提供虚拟试衣功能以提升购物体验。其图像增强与编辑功能包括智能修复和物体移除，还可将静态图片转为动态视频，支持多场景应用，有效降低拍摄成本并提升视觉吸引力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 590 浏览

像素猫AI

像素猫AI是一款专注于生成吉卜力风格图像的AI绘画工具，操作简便，用户只需选择风格并上传照片即可快速生成图像。平台支持像素画绘制、撤销与清除功能，并提供实时预览。适用于个人创作、设计辅助、艺术教育及表情包制作等多个场景，是创意表达和个性化设计的实用工具。

AI项目与工具 2025年06月12日 58 点赞 0 评论 589 浏览

ChangeFace.AI

一种AI换脸工具，它允许用户上传一张高分辨率的单人照片，然后将自己的脸和一些有趣的图像进行交换，比如名人、动漫、艺术、卡通等。

Ai图片处理 2025年06月05日 92 点赞 0 评论 589 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 588 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 587 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期