生成

DreamVideo

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架,能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块,这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

Nvidia·GET3D

我们通过两个潜在代码生成 3D SDF 和纹理场。我们利用 DMTet 从 SDF 中提取 3D 表面网格,并查询表面点处的纹理场以获取颜色。我们使用在 2D 图像上定义的对抗损失进行训练。

MakeAnything

MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架,能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型,支持从文本到过程和从图像到过程的双向生成。覆盖21个领域,包含超24,000个标注序列,具备良好的逻辑连贯性和视觉一致性,适用于教育、艺术、工艺传承及内容创作等多种场景。

GPT Pilot

GPT Pilot是一款AI编程工具,旨在通过模拟人类开发者的工作流程,帮助从零开始构建应用程序。它能够编写代码、调试程序、与用户讨论问题,并请求代码审查,是真正的AI开发者伙伴。GPT Pilot支持多种运行方式,包括VS Code扩展、命令行工具和Docker容器,使开发者能够在熟悉的环境中提升开发效率。其主要功能包括全功能代码生成、交互式问题解答、高度集成的开发环境、逐步开发、任务分配、开发

岩芯数智大模型

岩芯数智大模型是一个多功能的企业级AI解决方案,它通过提供高效的推理、快速的训练和高准确率,帮助企业提升知识管理能力、优化业务流程,并实现智能化升级。

开搭

开搭是一款无需编程基础即可构建AI应用的一站式开发平台。它提供拖拽式开发、参数配置、快速搭建及一键发布等功能,帮助用户轻松创建并发布AI机器人。该工具适用于客户服务、教育、健康咨询等多个领域,支持知识变现,适合各类人群参与AI创新。

ViVa AI

Sora同架构视频生成模型,支持文本生成视频、图片生成视频以及 4K 分辨率放大功能,另外也支持提示词的自动优化。

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架,支持高质量4D LiDAR场景的生成与重建,适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型,实现高效的场景编码与生成,支持轨迹引导、指令驱动生成和动态修复等多种应用,展现出优异的性能和广泛的应用潜力。

FramePainter

FramePainter 是一款基于AI的交互式图像编辑工具,结合视频扩散模型与草图控制技术,支持用户通过简单操作实现精准图像修改。其核心优势包括高效训练机制、强泛化能力及高质量输出。适用于概念艺术、产品展示、社交媒体内容创作等场景,具备低训练成本和自然的图像变换能力。

Shutterstock AI

Shutterstock AI是一款由Shutterstock与OpenAI合作开发的AI图像生成与编辑工具。它使用户能够通过简单的描述或文本提示,快速生成高质量、符合伦理标准的图片,适用于商业授权。该工具提供了六大核心功能,包括神奇画笔、变体生成、图像扩展、智能尺寸调整、背景移除以及AI图像生成器,旨在简化图片编辑流程并激发用户的创意灵感。