生成

Stable Video 3D (SV3D)

Stable Video 3D(SV3D)是一款由Stability AI公司开发的多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步优化生成高质量的3D网格模型。该模型在视频扩散模型基础上进行改进,提供更好的质量和多视角体验。主要功能包括多视角视频生成、3D网格创建、轨道视频生成、相机路径控制以及新视角合成。SV3D在新视角合成方面取得显著进展,能够生成逼真且一致的视图,提升

aoGen

aoGen 是一款面向电商行业的 AI 图像生成工具,可快速生成多种风格的虚拟模特并实现服装适配,提供虚拟试衣功能以提升购物体验。其图像增强与编辑功能包括智能修复和物体移除,还可将静态图片转为动态视频,支持多场景应用,有效降低拍摄成本并提升视觉吸引力。

SounDraw

SOUNDRAW是一个 A人工智能的音乐生成网站,它可以让所有的创作者自由地定制独特的、无版权的音乐。

Pixel Studio

Pixel Studio 是谷歌为 Pixel 9 系列手机预装的一款 AI 图像生成应用。它基于 Imagen 3 模型,能够快速生成艺术风格的图片,生成时间仅需约2秒。Pixel Studio 利用 Tensor G4 芯片,支持本地和云端生成方式,并具备 Gemini overlay 功能,便于用户直接分享生成的图片至邮件或聊天平台。该应用适用于艺术爱好者、设计师、社交媒体用户以及专业创作者

Musico

Musico 是一个人工智能驱动的软件引擎,可以生成音乐。 它可以对手势、动作、代码或其他声音做出反应。

Lamucal

Lamucal是一款由人工智能驱动的音乐创作工具,主要功能包括实时生成歌曲的和弦、吉他谱、歌词及旋律,支持AI翻唱、人声移除和音轨分离等操作。它不仅适用于个人音乐学习和音乐教育,还能满足音乐制作人和内容创作者的需求,广泛覆盖音乐创作、教学及娱乐场景。

VideoJAM

VideoJAM是Meta开发的视频生成框架,旨在提升视频运动连贯性。通过联合学习外观与运动信息,在训练阶段同时预测像素和运动特征,并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性,可适配多种视频生成模型,无需调整训练数据或模型结构,已在多项基准测试中表现优异,适用于影视、游戏、教育等多个领域。

WeDraw

WeDraw专注于人工智能AI绘画和大模型语料数据合成领域,是一支充满激情和创意的团队。

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。

Aicolors

AI Colors,人工智能生成界面配色方案。