多模态
GaussianAnything
GaussianAnything 是一款基于多模态输入的 3D 内容生成框架,支持点云、文本和图像等多种输入方式,能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型,具备几何与纹理解耦特性,适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异,为 3D 内容创作提供了高效解决方案。
WorldScore
WorldScore是由斯坦福大学推出的统一世界生成模型评估基准,支持3D、4D、图像到视频(I2V)和文本到视频(T2V)等多种模态。它从可控性、质量和动态性三个维度进行评估,涵盖3000个测试样本,包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能,适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用,为研究
Data Formulator
Data Formulator是由微软研究院开发的开源AI数据可视化工具,结合图形化界面与自然语言输入,支持复杂数据转换和图表迭代设计。用户可通过拖拽或指令创建可视化,AI自动处理数据转换和代码生成。具备数据验证、样式调整和多模态交互等功能,适用于数据分析、概念扩展及可视化优化场景。