3D重建 - 智狐AI导航

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 463 浏览

InstantMesh

一个基于单张图片，利用先进的稀疏视图大型重建模型（LRM）架构，快速生成3D网格（Mesh）的工具

Ai开源项目 2025年06月05日 51 点赞 0 评论 505 浏览

Fast3R

Fast3R是一种基于Transformer架构的高效多视图3D重建方法，可在单次前向传播中处理上千张图像，大幅提高重建效率并减少误差累积。支持多视图并行处理，具备高精度、强可扩展性和快速推理能力，适用于机器人视觉、增强现实、虚拟现实、文化遗产保护及自动驾驶等多个场景。

AI项目与工具 2025年06月12日 86 点赞 0 评论 577 浏览

Depth Pro

Depth Pro 是一款由苹果公司开发的先进单目深度估计模型，能够在不到一秒的时间内从单张2D图像生成高分辨率的3D深度图。它支持零样本学习，无需依赖相机内参即可提供度量级深度信息，并在细节捕捉方面表现出色。Depth Pro 在增强现实、3D重建、图像编辑、机器人导航和自动驾驶等领域展现出广泛的应用前景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 593 浏览

DUSt3R

DUSt3R是一个由芬兰阿尔托大学和Naver欧洲实验室联合研发的3D重建框架。该框架能够快速地从任意图像集合中重建出三维场景，无需事先了解相机校准或视点位置信息。DUSt3R主要功能包括快速3D重建、无需相机校准、多视图立体重建、单目和双目重建以及生成深度图、置信度图和点云图。它采用了点图表示法、Transformer网络架构和端到端训练方式，并提出了全局对齐策略来处理多视图重建任务。

AI项目与工具 2024年01月01日 53 点赞 0 评论 618 浏览

MV

MV-Adapter是一款基于文本到图像扩散模型的多视图一致图像生成工具，通过创新的注意力机制和条件编码器，实现了高分辨率多视角图像生成。其核心功能包括多视图图像生成、适配定制模型、3D模型重建以及高质量3D贴图生成，适用于2D/3D内容创作、虚拟现实、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 629 浏览

FaceLift

FaceLift是一种由Adobe与加州大学默塞德分校联合开发的AI工具，能够从单张人脸图像中重建出高精度的3D头部模型。其核心技术包括多视图扩散模型和GS-LRM重建器，支持多视角一致性、身份保持和4D新视图合成，适用于虚拟现实、数字娱乐、远程交互等多个领域。该工具具备强大的几何与纹理细节表现能力，且可与2D面部重动画技术集成，广泛应用于内容创作与科研场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 692 浏览

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具，它利用多视图视频扩散模型，从单目视频中生成动态3D（4D）场景表示。该工具可以合成新视图、重建动态3D模型，并支持独立控制相机视点和场景动态，适用于电影制作、游戏开发、虚拟现实等多种领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 702 浏览

Unique3D

Unique3D是一款由清华大学团队开发的开源框架，专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型，结合多级上采样策略和ISOMER算法，能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图，并通过多级上采样过程提高图像分辨率，最终实现颜色和几何细节的高度整合。

AI项目与工具 2025年06月12日 28 点赞 0 评论 708 浏览

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具，结合3D人体重建与扩散模型技术，支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力，适用于游戏、影视、体育及时尚等领域，具备高保真度与真实感。

AI项目与工具 2025年06月12日 36 点赞 0 评论 716 浏览

3D重建

首页

3D重建

列表

默认

浏览次数

发布日期