图像

DemoFusion

DemoFusion是一个技术框架,旨在低成本生成高分辨率图像。该框架通过扩展现有的开源生成人工智能模型(如Stable Diffusion),使得这些模型能够在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像转化为高清晰度图像。DemoFusion采用渐进式增强、跳跃残差和扩张采样机制,确保高分辨率图像生成的同时,保持图像的全局语义一致性和细节质量。适用于艺术创作、游戏开发、电影

Nexa AI

Nexa AI致力于生成高质量的AI生成产品图像。它可以根据用户上传的产品图片,自动去除背景并生成符合不同行业的适用模板。

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

AIGIF

AIGIF是一款基于AI技术的个性化GIF制作工具,允许用户通过上传自拍照,将自己的面部特征无缝嵌入到各种GIF动画中,生成具有高度真实感和娱乐价值的表情包。其核心功能包括智能人脸交换、快速生成、高保真图像质量和丰富素材库。平台注重隐私保护,并提供免费与付费两种订阅模式以适应不同用户需求。

Skywork R1V

Skywork R1V是昆仑万维推出的首个工业级多模态思维链推理模型,具备强大的视觉链式推理能力,可处理数学问题、科学现象分析、医学影像诊断等复杂任务。其技术基于文本推理能力的多模态迁移与混合式训练方法,在多项基准测试中表现优异。模型开源,适用于教育、医疗、科研、内容审核等多个领域,推动多模态人工智能的发展。

UNO

UNO是字节跳动推出的AI图像生成框架,支持单主体和多主体图像生成,解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术,结合通用旋转位置嵌入(UnoPE),实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域,具备强大泛化能力,已开源并提供完整技术文档。

Raphael

Raphael 是一款基于 Flux.1-Dev 模型的 AI 图像生成工具,无需注册即可使用。支持多种艺术风格,提供高质量图像生成,具备快速处理能力和严格的隐私保护机制。适用于艺术创作、内容设计、营销、游戏开发等多个领域,适合个人及商业用途。

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

IMI Prompt

IMI Prompt是一个全面的Midjourney v5艺术品提示生成器,用户可以创建独特的Midjourney v5艺术品,可在Web、Android和iOS上使用。