增强现实 - 智狐AI导航

HoloTime

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架，可将单张全景图像转化为动态视频，并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器（Panoramic Animator）和时空重建技术，结合 360World 数据集进行训练，实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用，适用于虚拟旅游、影视制作、游戏开发等多个领域，提供高效的沉

AI项目与工具 2025年06月11日 20 点赞 0 评论 725 浏览

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集，包含500个第一人称视角视频，涵盖77种日常活动，支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务，测试模型对长时间视频内容的信息识别与综合能力，推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制，使其成为学术研究的重要工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 724 浏览

AR Drawing

AR Drawing-Draw Sketch是一款基于增强现实技术的绘画辅助工具，允许用户上传图片并将其叠加至现实工作空间中，以实现精确临摹和创作。支持多种绘画类型，包括风景画和肖像画，具备调整图片透明度和大小的功能，适合艺术教育、个人娱乐、专业创作及艺术治疗等场景。

AI项目与工具 2025年06月12日 77 点赞 0 评论 712 浏览

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具，它利用多视图视频扩散模型，从单目视频中生成动态3D（4D）场景表示。该工具可以合成新视图、重建动态3D模型，并支持独立控制相机视点和场景动态，适用于电影制作、游戏开发、虚拟现实等多种领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 702 浏览

火山翻泽

火山翻泽是字节跳动旗下火山引肇团队推出的Ai翻译工具，内置权威词典、支持多种查词方式；10+ 语种丰富音色免费开放，练听力练跟读；PDF文字格式整理、对照阅读模式、个人术语库。

Ai办公效率 2025年06月05日 40 点赞 0 评论 680 浏览

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具，由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景，支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术，Wonder Animation在3D空间中重建场景，并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

AI项目与工具 2025年06月12日 43 点赞 0 评论 675 浏览

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱，支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能，采用传统图像处理与深度学习技术相结合的方式，提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 674 浏览

World Labs 空间智能模型

World Labs 空间智能模型是一款基于人工智能技术的工具，能够通过单张图片生成逼真的3D世界，并支持实时渲染与交互操作。其核心功能包括3D几何估算、场景补全、内容生成及相机效果模拟，广泛应用于电影、游戏、虚拟现实、教育以及建筑设计等多个领域，大幅提升了创作效率与视觉表现力。

AI项目与工具 2025年06月12日 60 点赞 0 评论 670 浏览

DNA

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库，它为广泛的研究任务提供了丰富的数据和高质量的注释。

创作工具 2026年06月23日 0 点赞 0 评论 653 浏览

Matryoshka Diffusion Models

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型，专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构，MDM实现了高效的信息共享与渐进式训练，显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境，可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练

AI项目与工具 2025年06月12日 18 点赞 0 评论 652 浏览

增强现实

首页

增强现实

列表

默认

浏览次数

发布日期