图像

雪鸮AI

雪鸮AI是一款功能全面的AI图像处理工具,支持大师模型、黑白上色、线稿提取、文字擦除、水印去除、图片放大及老照片修复等多种功能。适用于动漫、游戏、影视等行业,能有效提升设计效率与作品质量,适合设计师、学生及个人创作者使用。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。

幻图AI

幻图AI是一款基于AI技术的免费图像处理工具,支持文生图、图片和视频换脸、换装、头像定制等功能。用户通过简单的操作即可生成高质量的创意图像和视频,广泛应用于社交媒体、电商、广告设计和教育培训等领域,提供高效且个性化的视觉创作体验。

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

ImageBind

ImageBind是由Meta公司开发的开源多模态AI模型,能够整合文本、音频、视觉、温度和运动数据等多种模态的信息,并将其统一到一个嵌入空间中。该模型通过图像模态实现其他模态数据的隐式对齐,支持跨模态检索和零样本学习。它在增强现实(AR)、虚拟现实(VR)、内容推荐系统、自动标注和元数据生成等领域有广泛应用。

Hunyuan3D

Hunyuan3D-1.0 是腾讯推出的一款3D生成模型,支持文本和图像输入生成高质量3D资产。该模型采用两阶段方法,包含轻量版和标准版,具有快速生成和高质量重建的特点,广泛应用于3D创作、工业设计、建筑设计等领域。

SolidGrids

SolidGrids 使用高级算法来去除背景、调整照明、添加广告横幅等,在几秒钟内创建适销对路的广告图像。

Photo Room

人工智能背景生成器,描述您想要的图像,它会使用符合您确切要求的稳定扩散神奇地生成无限数量的独特背景

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型,专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术,实现对光照、阴影和遮挡关系的精准控制。支持多任务学习,提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域,具备高效、真实的图像编辑能力。

Story

Story-Adapter是一种无需额外训练的长篇故事可视化框架,通过迭代优化和全局参考交叉注意力模块,提升图像生成的质量与细节表现。该工具适用于多种场景,包括故事创作、教育学习、娱乐游戏、广告营销以及影视制作等,特别适合需要将文字转化为视觉化内容的场合。