TANGLED TANGLED是一种3D发型生成技术,可从多种风格和视角的图像中生成高质量发丝。其核心技术包括多视图线稿扩散框架与参数化后处理模块,支持复杂发型的细节修复。该工具具备文化包容性,适用于动画、AR及虚拟试妆等场景,提升发型设计效率与真实性。 AI项目与工具 2025年06月12日 71 点赞 0 评论 657 浏览
腾讯混元3D 全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速度和泛化能力的不足。 Ai开源项目 2025年06月05日 59 点赞 0 评论 656 浏览
Matrix3D Matrix3D 是一种由多所高校与科技企业联合开发的统一摄影测量模型,集姿态估计、深度预测、新视图合成与3D重建于一体。其核心技术为多模态扩散变换器,支持跨模态数据融合与灵活任务处理。通过掩码学习策略,提高数据利用效率并增强模型泛化能力。适用于VR/AR、游戏开发、影视制作等领域,具有高度交互性和灵活性。 AI项目与工具 2025年06月12日 49 点赞 0 评论 654 浏览
MarDini MarDini是一款融合掩码自回归(MAR)和扩散模型(DM)的先进视频生成工具,支持视频插值、图像到视频生成、视频扩展等多种任务。它通过优化计算资源分配,提高了视频生成的效率与灵活性,并具备从无标签数据中进行端到端训练的能力,展现出强大的可扩展性与效率。 AI项目与工具 2025年06月12日 44 点赞 0 评论 652 浏览
IMAGPose IMAGPose是由南京理工大学开发的统一条件框架,用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块,解决了传统方法在生成多样姿态图像时的局限性,适用于虚拟现实、影视制作、电商展示等多个领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 614 浏览
Unique3D Unique3D是一款由清华大学团队开发的开源框架,专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型,结合多级上采样策略和ISOMER算法,能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图,并通过多级上采样过程提高图像分辨率,最终实现颜色和几何细节的高度整合。 AI项目与工具 2025年06月12日 28 点赞 0 评论 614 浏览
CAT4D CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具,它利用多视图视频扩散模型,从单目视频中生成动态3D(4D)场景表示。该工具可以合成新视图、重建动态3D模型,并支持独立控制相机视点和场景动态,适用于电影制作、游戏开发、虚拟现实等多种领域。 AI项目与工具 2025年06月12日 72 点赞 0 评论 603 浏览
Prometheus Prometheus是一款基于潜在扩散模型的3D生成工具,能够从文本描述中快速生成高质量、高保真的3D场景。其核心技术包括两阶段训练框架、RGB-D潜在空间解耦、前馈生成策略和无分类器引导,确保生成结果在视觉和几何上的准确性与一致性。适用于内容创作、游戏开发、建筑设计等多个领域,显著提升了3D内容生成的效率和质量。 AI项目与工具 2025年06月12日 27 点赞 0 评论 577 浏览
BibiGPT BibiGPT是一款利用人工智能技术自动分析和提炼音视频内容的工具。它能够一键总结来自多个平台的音视频内容,并提供多样化的总结形式,包括摘要、思维导图、字幕列表和文章视图。此外,用户可以自由提问,以获取相关问题的答案。BibiGPT支持多客户端使用,包括iOS快捷指令、微信服务号、书签版、PWA客户端、Chromium内核的浏览器插件及电脑桌面端。它还提供了多种导出和保存选项,并支持与音视频内容进 AI项目与工具 2023年01月01日 82 点赞 0 评论 568 浏览