生成

SynCamMaster

SynCamMaster是一款由多家顶尖高校与企业联合研发的多视角视频生成工具,支持从任意视点生成高质量开放世界视频。其核心技术包括结合6自由度相机姿态、多视图同步模块以及预训练文本到视频模型的增强版本。SynCamMaster不仅能在不同视角间保持动态同步,还能实现新视角下的视频合成与渲染,广泛应用于影视制作、游戏开发、虚拟现实及监控系统等领域。

白日梦AI

一个文生视频类AIGC创作平台,支持文生视频、动态画面、AI角色生成、人物/场景一致性,可以将故事生成视频。

图趣AI

图趣AI是一款基于人工智能技术的创意工具,可通过文字描述生成多样化的艺术画作,涵盖风景、奇幻、艺术画及超现实等风格。它还提供AI艺术字、风格转换、平面设计及视频生成等功能,适用于个人创意表达、社交媒体内容创作、教育学习、广告营销及平面设计等多个领域。

MuseGate

MuseGate是一款依托生成式AI技术的电商营销工具,专注于服饰行业。它通过虚拟模特生成、场景定制、尺寸调整等功能,助力企业优化商品展示效果,降低运营成本,提升品牌形象。其核心功能包括虚拟模特生成、一键换装、场景定制、节点营销等,广泛应用于时尚展示、电子商务、广告宣传等领域。

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架,由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导,提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态,提供高分辨率基准数据集HR-VVT,适用于在线购物、时尚设计、影视制作等多个领域。

MagicSlides

MagicSlides是一款以AI为核心的演示文稿制作工具,支持从多种来源生成高质量PPT,包括主题、视频、文档或文本。它具有强大的内容自动生成能力,同时兼容Google Slides和Figma等平台,提供多语言支持和丰富的协作功能,适用于商务、教育、科研等多个领域。

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型,结合多模态大语言模型与扩散模型,支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力,适用于创意设计、内容创作等多个领域。

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型,结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式,包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成,并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出,适用于艺术创作、内容营销、游戏开发等多个领域。

Fancy123

Fancy123是一种基于深度学习的3D网格生成工具,利用单张图像生成高质量3D模型。其核心技术包括多视图扩散模型、大型重建模型、外观增强模块、保真度增强模块及反投影操作,能够有效解决多视图图像的局部不一致问题,提升网格保真度和清晰度。该工具适用于虚拟现实、游戏开发、影视制作等多个领域,具备高度灵活性和实用性。

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型,能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略,显著提升了模型在视觉理解与图像生成上的表现,广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。