图像 - 智狐AI导航

WorldDreamer

WorldDreamer 是一种基于 Transformer 的通用世界模型，具备理解与预测物理世界动态变化的能力，专注于视频生成任务。它支持多种应用场景，包括文本到视频、图像到视频、视频编辑和动作序列生成，利用视觉 Token 化、Transformer 架构和多模态提示技术，实现了高效且高质量的视频生成。

AI项目与工具 2025年06月12日 16 点赞 0 评论 789 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 789 浏览

Text Behind Image

Text Behind Image 是一款开源在线工具，支持用户在图片中主体背后添加自定义文字，提供多样化的样式定制选项，包括字体、颜色、位置等。它基于 Next.js 框架，采用前端图像处理技术，适配多种应用场景，如社交媒体营销、广告宣传、个人表达及教育用途。

AI项目与工具 2025年06月12日 65 点赞 0 评论 788 浏览

SketchGPT

SketchGPT 是一种基于AI技术可以从草图生成逼真产品图像的工具。这是一项免费且易于使用的服务，允许任何人使用 AI 创建他们梦想中的产品。

Ai图片处理 2025年06月05日 39 点赞 0 评论 787 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 787 浏览

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架，能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略，结合位置编码重用和无噪声条件范式，确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能，并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源，适用于数字艺术创作、商业设计、社交媒体等多个场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 784 浏览