图像生成

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

SDXL

SDXL-Lightning是一种基于扩散模型的文本到图像生成技术,由字节跳动的研究团队开发。该模型通过结合渐进式和对抗式蒸馏方法,能够在一至少数步骤内快速生成1024像素分辨率的高质量图像。该模型提供开源模型和权重,支持与现有的LoRA模块和控制插件兼容,可以轻松集成到现有的图片生成系统中。核心技术包括扩散模型、渐进式蒸馏、对抗式蒸馏和鉴别器设计,以确保生成图像的质量和多样性。

妙刷AI

美团推出的AI创作小程序,能够根据用户上传的图片生成风格迥异的图像和视频。妙刷小程序支持多种AI图像玩法,包括修图、文本生图、音频生图和视频生成等。

Omnitool

Omnitool是一款开源的AI桌面工具,提供统一界面整合多种AI模型,支持本地运行,保障数据隐私。兼容OpenAI、Stable Diffusion等主流平台,无需复杂配置即可实现图像生成、文本翻译、音频创建等功能。具备高扩展性,支持脚本和第三方工具集成,适用于从初学者到开发者的多场景应用,涵盖艺术创作、教育、企业开发等领域。

Poify

Poify是一款由快手推出的AI图像生成工具,支持AI模特试衣、背景更换、局部重绘等功能,帮助商家和创作者高效生成高质量商品展示图及创意内容。用户可通过文字或图片输入,快速生成符合需求的视觉作品,适用于电商营销、海报设计、社交媒体等内容创作场景,提升视觉吸引力和传播效果。

吐司AI写真

吐司AI写真是一款基于AI技术的图像生成工具,支持对用户上传的照片进行风格化处理,输出高逼真度的写真图像。功能涵盖风格转换、模板创作、参数自定义及多场景应用,适用于社交媒体、个人形象设计、广告制作等多个领域。用户可通过简单操作实现个性化内容创作,适合各类创作者和设计师使用。

Imagine Yourself

Imagine Yourself是一款由Meta公司开发的个性化AI图像生成模型,无需针对特定用户进行调整即可生成高质量、多样化的图像。该模型采用了合成配对数据生成和并行注意力架构,提升了图像质量和文本对齐的准确性。主要功能包括无需特定微调、生成合成配对数据、并行注意力架构以及多阶段微调过程。应用场景广泛,包括社交媒体个性化、虚拟试衣间、游戏和虚拟现实、广告和营销以及艺术创作辅助。

ChangeFace.AI

一种AI换脸工具,它允许用户上传一张高分辨率的单人照片,然后将自己的脸和一些有趣的图像进行交换,比如名人、动漫、艺术、卡通等。

StoryMaker

StoryMaker 是一款基于 Stable Diffusion XL 模型和 LoRA 技术的文本到图像生成工具,专为保持连续图像中角色一致性而设计。其核心功能包括角色一致性维护、多角色处理、高质量图像生成及叙事创作支持。通过深度学习和面部特征识别技术,StoryMaker 能够生成细节丰富、视觉一致的图像,广泛应用于漫画、游戏、影视制作及广告创意等领域。

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。