图像

PNGMaker

PNGMaker 是一款基于 AI 技术的在线工具,可将文本快速转换为透明背景的 PNG 图像。支持自定义字体、颜色和排版,适用于网页设计、社交媒体营销、品牌标识及广告材料等多种场景。用户可通过简单操作生成高质量图像,提升设计效率与视觉表现力。

Explorer

Explorer是一款由Odyssey公司研发的生成性世界模型,主要功能包括将图像转换为高质量的3D场景,并支持动态效果生成。它利用高斯溅射技术和先进的图像识别算法,实现逼真的视觉效果。Explorer生成的场景可无缝集成到主流创作软件中,广泛应用于电影、游戏开发、虚拟现实等领域,显著提升内容创作效率。

APISR

一个专注于动漫图像超分辨率的项目,旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

BrushNet

BrushNet是一款基于扩散模型的图像修复工具,采用双分支架构处理遮罩区域。它能够实现像素级修复,保持修复区域与原始图像的一致性和高质量。BrushNet适用于多种场景和风格的图像,包括人类、动物、室内和室外场景,以及自然图像、铅笔画、动漫、插画和水彩画等。通过与预训练扩散模型结合,BrushNet提供灵活的修复控制,同时保留未遮罩区域的细节。

Personalized Restoration

一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。

StoryMaker

StoryMaker 是一款基于 Stable Diffusion XL 模型和 LoRA 技术的文本到图像生成工具,专为保持连续图像中角色一致性而设计。其核心功能包括角色一致性维护、多角色处理、高质量图像生成及叙事创作支持。通过深度学习和面部特征识别技术,StoryMaker 能够生成细节丰富、视觉一致的图像,广泛应用于漫画、游戏、影视制作及广告创意等领域。

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

LogMeal Food AI

LogMeal Food AI是一家为食品识别、食品跟踪和快速餐厅结账提供人工智能和深度学习解决方案的公司。

Dreamlike.Art

Dreamlike.Art是一个免费的人工智能艺术生成器和创作工具,利用人工智能的力量,用户可以在几秒钟内创建令人惊叹的原创艺术。它提供图像升级、创建变化、修复面部等功能。