图像 - 智狐AI导航

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 590 浏览

Toona.io

一个提供生成和分享动画漫画、动态漫画和动感漫画工具平台。Toona通过提供图像修复、自动上色、图像增强和动画生成等功能来让漫画创作更简单。

Ai图片处理 2025年06月05日 54 点赞 0 评论 590 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 589 浏览

MemeCam.ai

一个在几秒钟内用你的照片创建超级有趣的表情包AI工具。

Ai绘画生成 2025年06月05日 71 点赞 0 评论 589 浏览

像素猫AI

像素猫AI是一款专注于生成吉卜力风格图像的AI绘画工具，操作简便，用户只需选择风格并上传照片即可快速生成图像。平台支持像素画绘制、撤销与清除功能，并提供实时预览。适用于个人创作、设计辅助、艺术教育及表情包制作等多个场景，是创意表达和个性化设计的实用工具。

AI项目与工具 2025年06月12日 58 点赞 0 评论 589 浏览

Steamer

Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型，能够将静态图像转化为动态视频，具备卓越的视觉生成能力。该模型基于 Transformer 扩散架构，支持多模态输入，包括中文文本提示和参考图像，实现像素级的画面控制与电影级构图效果。在 VBench 评测中荣获榜首，生成高清 1080P 视频，优化时间一致性与运动规律性，适用于广告、影视、游戏开发和内容创作等多个领域。

AI项目与工具 2025年06月11日 95 点赞 0 评论 589 浏览

Fancy123

Fancy123是一种基于深度学习的3D网格生成工具，利用单张图像生成高质量3D模型。其核心技术包括多视图扩散模型、大型重建模型、外观增强模块、保真度增强模块及反投影操作，能够有效解决多视图图像的局部不一致问题，提升网格保真度和清晰度。该工具适用于虚拟现实、游戏开发、影视制作等多个领域，具备高度灵活性和实用性。

AI项目与工具 2025年06月12日 55 点赞 0 评论 589 浏览