图像 - 智狐AI导航

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架，采用区域注意力机制实现对图像中实体的精确控制，支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练，具备强大泛化能力，适用于虚拟场景、角色设计、数据合成及产品展示等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 883 浏览

啵啵动漫

啵啵动漫是一款基于AI技术的视频处理工具，支持将普通视频一键转换为多种动漫风格，提供丰富的模板和自定义选项。平台涵盖AI写真、AI魔法脸、AI文生图等功能，支持音乐、特效添加，适用于个人创作、二次元文化体验及创意视频制作。用户还可浏览社区内容并进行互动，提升创作体验。

AI项目与工具 2025年06月12日 56 点赞 0 评论 720 浏览

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 712 浏览

Agentic Object Detection

Agentic Object Detection是由吴恩达团队研发的新型目标检测技术，通过智能代理系统实现无需标注数据的目标识别。用户输入文字提示后，AI可精准定位图像中的目标及其属性，支持内在属性、上下文关系及动态状态的识别。该技术无需复杂训练流程，适用于装配验证、作物检测、医疗影像分析、危险物品识别和商品管理等多种场景，显著提升了检测效率和准确性。

AI项目与工具 2025年06月12日 18 点赞 0 评论 901 浏览

ImageToPromptAI

ImageToPromptAI 是一款AI驱动的图像转文本工具，可快速生成高精度的图像描述，适用于图像生成、艺术创作及内容设计等领域。其功能包括图像分析、文本提示生成和隐私保护，支持多场景应用，助力创作者提高效率与创意表现。

AI项目与工具 2025年06月12日 16 点赞 0 评论 766 浏览

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具，通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略，确保编辑内容自然融合，保留原始细节。支持真实图像和多部分同时编辑，无需重新训练模型，适用于艺术设计、影视制作、广告等多个领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 576 浏览

BEN2

BEN2是一款由Prama LLC开发的深度学习图像和视频处理工具，专注于高效、精准的背景移除与前景分割。采用置信度引导抠图技术，可处理复杂细节，如头发和边缘，确保高精度分割。支持4K图像处理，具备GPU加速功能，适用于图像编辑、视频剪辑及批量处理等多种应用场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 810 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 835 浏览

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 572 浏览

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 639 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期