图像 - 智狐AI导航

OpenAI o3

OpenAI o3是一款具备图像推理能力的AI模型，融合了神经符号学习与概率逻辑，支持多模态任务处理。它能够自主调用工具解决复杂问题，擅长编程、数学、科学等领域，同时在安全性方面进行了显著优化。o3在多基准测试中表现优异，提供透明的推理路径和高效的多任务处理能力。

AI项目与工具 2025年06月12日 85 点赞 0 评论 816 浏览

Aitubo

Aitubo是一款基于先进Flux模型的AI图像和视频生成平台，支持用户通过文本提示生成高质量图像，并具备背景移除、图像放大增强、AI外扩绘画以及人脸交换等功能，广泛应用于游戏开发、动漫制作、艺术创作及广告营销等领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 874 浏览

Explorer

Explorer是一款由Odyssey公司研发的生成性世界模型，主要功能包括将图像转换为高质量的3D场景，并支持动态效果生成。它利用高斯溅射技术和先进的图像识别算法，实现逼真的视觉效果。Explorer生成的场景可无缝集成到主流创作软件中，广泛应用于电影、游戏开发、虚拟现实等领域，显著提升内容创作效率。

AI项目与工具 2025年06月12日 39 点赞 0 评论 626 浏览

UniReal

UniReal是一款由香港大学与Adobe研究院合作开发的多功能图像处理框架，能够实现图像生成、编辑、定制和合成等任务。它通过视频生成模型的设计理念，利用大规模视频数据作为监督源，学习图像间的连贯性与变化性，生成高质量的逼真图像。该框架特别擅长处理复杂的场景，支持多种应用场景，包括数字内容创作、媒体娱乐、广告营销、电子商务及教育等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 699 浏览

MV

MV-Adapter是一款基于文本到图像扩散模型的多视图一致图像生成工具，通过创新的注意力机制和条件编码器，实现了高分辨率多视角图像生成。其核心功能包括多视图图像生成、适配定制模型、3D模型重建以及高质量3D贴图生成，适用于2D/3D内容创作、虚拟现实、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 633 浏览

nijijourney

Nijijourney是一款由Spellbrush和Midjourney合作开发的AI工具，主要功能包括基于文本指令生成二次元风格图像、支持图像风格转换、细节微调以及多语言兼容性。它广泛应用于艺术创作、游戏开发、动画制作、漫画绘制及小说插图等领域，帮助用户高效完成高质量的二次元风格视觉内容。

AI项目与工具 2025年06月12日 94 点赞 0 评论 822 浏览

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型，具备检索增强、上下文学习及超分辨率技术，能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值，同时支持学术研究和技术探索。

AI项目与工具 2025年06月12日 96 点赞 0 评论 879 浏览

Ivy

Ivy-VL是一款专为移动端和边缘设备设计的轻量级多模态AI模型，具备约30亿参数，专注于视觉问答、图像描述及复杂推理等任务，能够有效降低计算资源需求，同时在多模态任务中表现出色，尤其适用于增强现实、智能家居及移动学习等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 696 浏览

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具，基于 OCR 和机器翻译技术，实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译，包括日文、中文、英文和韩文，并具备图像合成能力，保持原图风格。工具提供批量处理和在线/离线翻译功能，适用于漫画爱好者、语言学习者以及出版商等用户群体。

AI项目与工具 2025年06月12日 16 点赞 0 评论 612 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 812 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期