图像
MakeAnything
MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架,能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型,支持从文本到过程和从图像到过程的双向生成。覆盖21个领域,包含超24,000个标注序列,具备良好的逻辑连贯性和视觉一致性,适用于教育、艺术、工艺传承及内容创作等多种场景。
PaliGemma 2 mix
PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。
Masterpiece X
Masterpiece X 是一款基于AI的3D建模工具,支持通过文本或图像生成高质量3D模型,具备自动纹理、骨骼绑定和动画功能,支持多格式导出并兼容主流3D软件。无需专业技能,适合艺术创作、游戏开发、影视制作等多种场景,提升创意效率与设计体验。