图像生成

Frames

Frames是一款由Runway开发的AI图像生成工具,其核心功能在于通过风格控制与高视觉保真度,支持用户生成一致且多样化的高质量图像。该工具可应用于电影、游戏、艺术创作等多个领域,帮助用户探索创意方向并实现精准的设计目标。其主要特点包括风格化图像生成、创意灵活性以及广泛的场景适配能力。

FLUX.1 Kontext

FLUX.1 Kontext是由Black Forest Labs推出的图像生成与编辑模型,支持上下文感知的图像处理。它基于文本和图像提示进行生成与编辑,具备对象修改、风格转换、背景替换、角色一致性保持和文本编辑等功能。FLUX.1 Kontext Pro版本支持快速迭代编辑,Kontext Max版本在提示词遵循和排版生成方面表现优异,而dev开源版本适合定制化开发。

通义万相

通义万相,一个不断进化的人工智能艺术创作大模型,擅长将奇思妙想转化为图画。

BAGEL

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架,支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控,具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能,广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

Yodayo AI | 文本生成动漫图片

Yodayo是一个AI文本生成动漫图片工具,是一款先进的人工智能系统,它可以根据你输入的文字或图片,自动生成出免费、高质量的动漫风格的画面。

DeepMesh

DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架,结合强化学习与自回归变换器技术,实现高质量、高精度的3D模型生成。支持点云和图像条件输入,具备高效的预训练策略与人类偏好对齐机制,适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。

PromptDodo

一个通过整合Stable Diffusion、DALL-E 和 Midjourney 等 ai 绘图工具生成AI 图像的提示词网站。

MCA

MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架,通过引入SAGI和SALQ注意力控制策略及主体定位模块,提升图像生成质量与一致性。支持零样本图像生成,适用于主体特征保持、背景一致性维护等多种任务,广泛应用于数字内容创作、广告设计、艺术创作等领域。

Unrealme

Unrealme是一项允许用户将自己的自拍照转化为AI生成的角色的服务。借助人工智能的帮助,你可以成为任何人!