图像处理

百度网盘AI修图

百度网盘AI修图是一款基于AI技术的专业人像处理工具,提供包括AI美颜、智能美型、背景修复和衣物去皱等功能。它能够智能识别和处理面部瑕疵、背景褶皱及衣物折痕,使照片呈现更自然的效果。支持批量处理和预设模板,极大提升了修图效率,适用于个人用户、专业摄影师、影楼和广告行业等多种场景。

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具,支持多语言翻译,涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库,实现从文本检测、OCR 到翻译渲染的全流程自动化,旨在帮助用户突破语言限制,享受跨文化阅读体验。同时,该工具支持自定义翻译服务,适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

Pixian.AI

Pixian.AI是一款基于人工智能的一键抠图工具,特别适合需要快速、高质量处理图片背景的用户。该工具无需订阅,提供高效且经济的解决方案,尤其在Beta测试阶段,用户可以免费使用。...

designtools.ai

DesignTools.ai 是一个集成了多种 AI 技术的专业设计平台,专为 UI 和 UX 设计师量身打造。它提供了包括 UI/UX 工具、配色方案生成、图像处理、排版设计、市场营销工具以及生产力提升工具在内的全面服务。通过这些功能,设计师可以更高效地完成各种设计任务,包括生成高质量的产品图像、创建 3D 模型、制定营销内容以及优化日常工作流程。

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具,通过物理渲染引擎生成合成数据并结合多任务训练策略,实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像,生成自然的高光、阴影和漫反射效果,并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域,具备良好的泛化能力和实用性。

改图鸭

改图鸭是一个在线图片处理工具,用户无需下载、安装任何程序,即可在线对图片进行多种编辑处理。它拥有多功能图片处理功能,如图片编辑、图片格式转换、证件照制作、图片变漫画、...

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。

Alpaca

Alpaca 是一个强大的 AI 工具,它为艺术家和创意人士提供了一个创新的数字画布。通过其快速迭代、风格生成和非破坏性工作流的特点,Alpaca 能够帮助用户提升创作效率,实现个性化...

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型,专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,实现对复杂视觉语言任务的高效处理,包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。