图像 - 智狐AI导航

GeoSpy

GeoSpy是一款基于AI技术的照片地理定位工具，可准确识别照片拍摄位置并输出经纬度坐标。它支持批量处理、地图集成和API接口，适用于研究、执法、新闻核实等多种场景，帮助用户深入挖掘图像背后的地理信息。

AI项目与工具 2025年06月12日 54 点赞 0 评论 683 浏览

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集，包含约20万个多模态样本，涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力，并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量，适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 683 浏览

NightCafe

NightCafe是一款基于人工智能技术的在线艺术生成平台，支持用户通过文本描述或图片生成多样化的艺术作品。平台提供多种算法（如Stable Diffusion、DALL-E 2等），支持风格迁移与图像增强，并拥有活跃的社区功能，用户可分享作品、参与挑战及互动交流。此外，NightCafe还支持将艺术作品打印为实体形式。

AI项目与工具 2025年06月12日 12 点赞 0 评论 683 浏览

imgkits

Imgkits 是一个基于人工智能的图像处理平台，提供去除水印、对象移除、背景替换、艺术化滤镜应用、照片修复及增强等多功能服务。该工具旨在提升图片质量和视觉效果，适用于社交媒体、电商、广告设计和个人照片编辑等多个领域。平台注重用户隐私，确保数据的安全性和高效性。

AI项目与工具 2025年06月12日 85 点赞 0 评论 683 浏览

CogAgent

CogAgent是一款由清华大学与智谱AI联合开发的多模态视觉大模型，专注于图形用户界面（GUI）的理解与导航。它具备视觉问答、视觉定位、GUI Agent、高分辨率图像处理及多模态能力，可应用于自动化测试、智能交互、多模态人工智能应用开发、企业级AI Agent平台等多个领域。CogAgent在多个基准测试中表现出色，尤其在GUI操作数据集上显著超越现有模型。

AI项目与工具 2025年06月12日 66 点赞 0 评论 684 浏览

Magic Studio

Magic Studio根据图片生成肖像图或者头像图、删除图片不必要的物品、自动去除背景，图片无损放大，还有生成式图片功能。

图片处理 2025年06月05日 33 点赞 0 评论 684 浏览

Topaz Photo AI

Topaz Photo AI 是一款使用人工智能（AI）来提高照片和视频质量的软件。它可以通过先进的技术锐化、去除噪点来提高图像的分辨率。

Ai图片处理 2025年06月05日 12 点赞 0 评论 684 浏览

ColoringBook

一个提供免费的AI涂色画生成器的网站，ColoringBook.AI通过文本和图像创建自定义的涂色画，并下载成千上万的可打印页面。

Ai图片处理 2025年06月05日 28 点赞 0 评论 684 浏览

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架，支持图像、音频、视频和文本等多种输入条件，生成高质量定制化视频。采用文本-图像融合与图像ID增强技术，提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景，具备音频驱动和视频驱动两种生成方式，展现强大可控性与灵活性。

AI项目与工具 2025年06月11日 73 点赞 0 评论 684 浏览

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架，支持对相机和物体运动的细粒度控制。它基于3D感知运动表示，结合U-Net架构的扩散模型，实现多种运动相关的视频合成任务，如运动生成、运动克隆、转移和编辑。通过三阶段训练策略，提升运动控制精度和稳定性，适用于影视、游戏、VR/AR、广告及教育等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 684 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期