文本到图像

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架,支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控,具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能,广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

TextDiffuser-2

一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。

Stability AI开源Stable Diffusion 3 Medium文生图模型

Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型,拥有20亿个参数,适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力,以及高资源效率。此外,它还支持API试用,并得到了NVIDIA和AMD的支持,以优化其性能。Stability AI致力于开放和安全的AI应用,并计划持续改进SD3 Medium。

SoulGen

SoulGen是一款基于AI的艺术生成平台,支持文本到图像的转换、图像编辑、边界扩展及相似肖像生成等功能。它适用于个人艺术创作、角色设计、概念艺术、广告设计以及社交媒体内容制作等多个领域,提供灵活高效的创意解决方案。

VectorArt.ai

VectorArt.ai 是一款基于人工智能技术的在线平台,专注于通过文本或草图生成高质量的矢量图像。它支持 SVG 格式,具备无损缩放特性,适用于网页设计、平面印刷等多个场景。主要功能包括文本到图像生成、草图到图像转换、自定义 SVG 创建及多种插画风格选择,同时提供免费图像资源和布局优化工具。

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具,能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格,具备图像编辑和调整功能,适用于艺术创作、设计、社交媒体内容制作等多个领域。

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具,包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块,能够通过文本描述和掩码对图像进行精确编辑和扩展,支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术,结合结构引导和文本到图像转换功能,适用于多种应用场景,包括数字艺术创作、游戏开发、

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架,通过高质量提示构建、偏好采样和分布加权机制,提升图像质量和与人类偏好的对齐度,减少训练崩溃风险。它具备自演化能力,降低对大规模数据的依赖,广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

Anifusion

Anifusion是一款基于人工智能技术的在线漫画与动漫图片生成平台,允许用户通过输入描述性提示生成专业级别的漫画页面和角色图像。平台具备丰富的编辑工具,如画布编辑器、布局工具以及图像编辑功能,支持用户对生成内容进行细化调整。其应用场景广泛,涵盖独立漫画创作、教育内容制作、营销材料设计等领域。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。