文本到图像

In

In-Context LoRA是一种基于扩散变换器(DiTs)的图像生成框架,通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构,减少了对大规模标注数据的依赖,同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能,适用于故事板生成、字体设计、家居装饰等多个领域。

ComfyGen

ComfyGen是一款基于大型语言模型(LLM)的文本到图像生成系统,能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流,并采用两种基于LLM的方法优化图像生成质量,适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

AISEO Art

AISEO Art是一款基于AI技术的艺术生成平台,支持用户通过文本提示生成个性化视觉艺术作品。平台提供包括AI头像生成、图像变体、艺术模板选择及滤镜应用在内的多项功能,适用于广告设计、数字艺术创作、游戏开发及社交媒体营销等多个场景,助力用户高效产出高质量视觉内容。

Lumina

Lumina-Image 2.0 是一款开源图像生成模型,基于扩散模型与 Transformer 架构,具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像,支持中英文提示词,并具备强大的复杂提示理解能力。模型支持多种推理求解器,适用于艺术创作、摄影风格图像生成及逻辑推理场景,兼具高效性和灵活性。

DanceGRPO

DanceGRPO 是由字节跳动与香港大学联合开发的视觉生成强化学习框架,支持文本到图像、文本到视频、图像到视频等多种任务,兼容多种生成模型与奖励机制。其通过强化学习优化生成过程,提升视觉内容质量与一致性,降低显存压力,提高训练效率与稳定性,适用于视频生成和多模态内容创作。

Yodayo

Yodayo 是一个面向动漫爱好者和虚拟主播的在线AI艺术创作平台,主要功能包括文本到图像生成器、模型选择、探索页面以及虚拟聊天室。用户可以通过输入文本提示词,利用AI技术生成高质量的动漫风格图像。该平台鼓励创意分享和社区互动,提供直观的用户界面和先进的AI技术,激发用户的创意灵感。

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型,具备17亿参数,支持多种图像风格生成,包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色,适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构(MoE),并集成多种文本编码器,实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源,便于研究与应用。

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型,专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题,并支持以即插即用的形式融入现有扩散模型,无需重新训练即可实现高效的空间控制。

Mage

Mage是一款利用先进AI技术将文本转换为高质量数字艺术作品的创意平台。它支持多种艺术风格和自定义参数,操作简便高效,适用于插画、设计及内容创作等多个领域。平台具备用户友好的界面设计,提供免费基础服务,鼓励社区互动与灵感交流。

智谱AI绘画

智谱AI绘画可根据用户的描述创作出新的艺术作品,还能够模仿不同的艺术风格,提供个性化的图像编辑和创作服务