图像生成

快手可图

快手可图大模型(Kolors)是快手公司自主研发的一款AI图像生成工具。支持文生图和图生图两大功能并提供了20多种AI图像玩法,Kolors可用于AI创作图像以及AI形象定制。

Magician.Design

Magician.Design是一款由 AI 提供支持的Figma设计工具插件。您可以将其安装在 Figma 上,并在 AI 的帮助下用于增强您的设计工作流程。

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型,擅长处理复杂提示词,生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项,适用于艺术创作、广告设计、电商展示等多种场景,极大提升了相关行业的设计效率与成果质量。

ComfyUI客户端

ComfyUI客户端是一款专为图像生成与处理设计的桌面应用程序,支持Windows和Mac系统。它具备一键安装、自动更新及预配置Python环境等功能,可帮助用户快速搭建AI生图流程。软件提供丰富的节点连接选项,支持图像生成、编辑、修复以及虚拟现实场景构建等多样化应用场景,适用于艺术家、设计师及医学影像专家等领域。

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型,具备17亿参数,支持多种图像风格生成,包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色,适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构(MoE),并集成多种文本编码器,实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源,便于研究与应用。

BiGR

BiGR是一种基于二进制编码的条件图像生成模型,集成了生成与判别任务于同一框架,支持高质量图像生成、视觉辨别和编辑。它通过掩码建模机制和二进制转码器实现高效的图像重建与预测,无需针对特定任务进行结构修改或参数调整,适用于多种视觉任务,如艺术创作、内容生成、广告设计、图像修复等。

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具,支持高精度视频编解码与中文文字生成,具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成,适用于影视制作、广告视频、教学辅助、文化创作等多个领域,提供高效的创作体验与高质量输出。

CLEAR

CLEAR是一种由新加坡国立大学推出的新型线性注意力机制,能够有效提升预训练扩散变换器生成高分辨率图像的效率。该机制通过局部注意力窗口和知识蒸馏技术,实现了线性复杂度,显著减少了计算量和时间延迟,同时保持了高质量的图像生成效果。CLEAR还支持跨模型泛化、多GPU并行推理以及稀疏注意力优化,广泛适用于数字媒体创作、虚拟现实、游戏开发等多个领域。

文心iRAG

文心iRAG是百度推出的一种检索增强型文生图技术,它通过结合百度搜索引擎中的海量图片资源与先进基础模型能力,解决了大模型在文生图时容易出现的幻觉问题,显著提高了生成图片的真实性和准确性。此技术不仅适用于广告、媒体、教育等多个领域,还具备低成本、高效率的特点,能够快速生成满足需求的高质量图像。

EasyControl

EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。