图像 - 智狐AI导航

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 712 浏览

LuminaBrush

LuminaBrush是一款基于深度学习的图像照明生成工具，采用两阶段处理流程：首先提取图像的均匀光照状态，再根据用户涂鸦生成具体光照效果。它支持实时调整光照参数，适用于复杂图像细节处理，广泛应用于数字艺术、游戏设计、影视后期等领域。工具提供交互式界面，便于用户高效创作。

AI项目与工具 2025年06月12日 81 点赞 0 评论 643 浏览

Avat3r

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的高保真三维头部头像生成模型，基于高斯重建技术，仅需少量输入图像即可生成高质量且可动画化的 3D 头像。其核心优势在于使用交叉注意力机制实现表情动态化，支持多源输入，具备良好的鲁棒性和泛化能力。适用于 VR/AR、影视制作、游戏开发及数字人等领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 668 浏览

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架，采用“下一个X预测”和“噪声上下文学习”技术，提升视觉生成的准确性和效率。其支持多种预测单元，具备高性能生成能力，在ImageNet数据集上表现优异，适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 549 浏览

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具，支持零样本多语言生成，提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器，实现文本与图像的高效交互。实验表明其性能优于现有方法，适用于艺术创作、广告设计、影视制作等多个领域，具备高效、灵活和高质量的生成能力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 523 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 700 浏览

Pika 2.2

Pika 2.2 是一款基于深度学习的AI视频生成工具，支持文本和图片输入，可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术（Pikaframes）和电影画幅比例支持，提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域，操作简便，适合各类用户快速生成创意视频。

AI项目与工具 2025年06月12日 34 点赞 0 评论 526 浏览

Ideogram 2a

Ideogram 2a 是 AI 图像生成平台 Ideogram 推出的文生图模型，基于 Ideogram 2.0 优化升级，具备高效生成、成本降低、高质量文本渲染等特点。支持多种艺术风格和中文提示，适用于平面设计、数字营销、摄影及艺术创作等多个领域，是提升图像创作效率和质量的实用工具。

AI项目与工具 2025年06月12日 78 点赞 0 评论 711 浏览

easypic

Easypic 是一款基于人工智能的在线图片处理工具，专为快速去除图片背景而设计。它支持多种图片格式和应用场景，如人像、电商产品、动植物及设计元素等。工具具备高效的AI抠图能力，可保持图像主体完整性，并提供背景替换和高清导出功能。目前，Easypic 为用户提供免费服务，适合各类图像编辑需求。

AI项目与工具 2025年06月12日 56 点赞 0 评论 715 浏览

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型，擅长处理图像与文本信息，具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异，支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术，提升推理准确性与可解释性，适用于科研、教育、医疗及自动驾驶等场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 692 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期