生成

Diffuse

Diffuse 是一款基于 AI 技术的视频编辑工具,支持用户通过自拍照生成个性化虚拟角色,并结合文本或图像生成高质量视频内容。其功能包括动作模仿、文本到视频生成、预剪辑选择及提示编辑,适用于社交媒体、广告、教育等多种场景。该工具专注于移动端使用,提升视频创作的便捷性与灵活性。

Crypko.Ai

crypko.ai是一款基于AI的动漫角色生成工具。不需要绘画基础,用户即可修改角色的设计,添加自然的动画。

Pmai

PMAI是一款面向产品经理的生产力工具,具有一键生成PRD、输出解决方案、生成SQL等实用功能。

Blackink AI纹身

Blackink AI纹身助手是一个基于人工智能技术的AI纹身设计助手,可以帮助用户生成高质量的纹身效果。

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具,能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术,实现快速、精确的几何与纹理重建,并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

BnbIcons

BnbIcons是一款AI驱动的图标生成工具,能够创建类似Airbnb风格的等轴测图标。用户可通过文字描述或上传参考图片生成图标,提供464+个预设图标,支持批量生成和图标动画功能,适用于界面设计、原型设计、社交媒体内容等多种场景。

MM

MM-StoryAgent是由上海交通大学X-LANCE实验室与阿里巴巴集团联合开发的开源多模态、多智能体框架,用于生成沉浸式有声故事绘本视频。它结合大型语言模型与多模态生成技术,通过多阶段写作流程和模态对齐优化,提升故事内容的质量与连贯性。支持灵活模块化设计,适用于儿童教育、数字内容创作、在线教育等多个场景,为故事创作提供高效、可定制的解决方案。

Notebook LM

Google Labs开发的实验性AI工具。它利用生成式AI技术,帮助用户快速整理和总结笔记。用户可以输入各种文本或PDF文件,NotebookLM会自动组织内容并提供建议。

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。