图像

imgkits

Imgkits 是一个基于人工智能的图像处理平台,提供去除水印、对象移除、背景替换、艺术化滤镜应用、照片修复及增强等多功能服务。该工具旨在提升图片质量和视觉效果,适用于社交媒体、电商、广告设计和个人照片编辑等多个领域。平台注重用户隐私,确保数据的安全性和高效性。

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具,它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术,为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容,满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白,成为无设计经验者快速产出高质量绘本的理想选择。

GeoSpy

GeoSpy是一款基于AI技术的照片地理定位工具,可准确识别照片拍摄位置并输出经纬度坐标。它支持批量处理、地图集成和API接口,适用于研究、执法、新闻核实等多种场景,帮助用户深入挖掘图像背后的地理信息。

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架,用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块,解决了传统方法在生成多样姿态图像时的局限性,适用于虚拟现实、影视制作、电商展示等多个领域。

Stable Diffusion 3.5

Stable Diffusion 3.5是一套由Stability AI开发的先进AI图像生成模型,包含多个版本以适应不同需求。它具备高定制性、高效的消费级硬件运行能力和开源许可,能够生成高质量、多样化的图像,支持多种风格和肤色表现。其核心技术基于多模态学习和优化的架构,适用于艺术创作、游戏开发、广告设计等多个领域。 ---

freeflo

FreeFlo 是一款面向创意工作者的 AI 工具,提供丰富的艺术风格提示词库,支持主流 AI 图像生成平台。其功能涵盖风格化提示词、SREF 参数代码及精选图片资源,适用于艺术创作、平面设计、游戏开发、影视制作及教育等多个领域,助力提升创意项目的效率与质量。

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

FaceFancy

FaceFancy是一款集成AI换脸、图像编辑与创意生成功能的应用,支持照片和视频换脸、多种风格头像生成、年龄与性别变换、旧照修复及特效滤镜等功能,适用于创意娱乐、个人形象设计及社交分享等场景,提升用户创作体验。