生成

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

FaceFancy

FaceFancy是一款集成AI换脸、图像编辑与创意生成功能的应用,支持照片和视频换脸、多种风格头像生成、年龄与性别变换、旧照修复及特效滤镜等功能,适用于创意娱乐、个人形象设计及社交分享等场景,提升用户创作体验。

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

Pandora Avatars

用户可以从100多种独特的头像风格中选择,并能够在所有社交媒体平台上以高清质量使用它们。

Codeium

Codeium是现代编码超级大国,是一个免费的人工智能代码完成工具。它支持超过20多种语言,并与您最喜欢的ide集成。

RandomX.AI

一个免费的AI驱动的中文名字生成器,专为创建真实的中文名字而设计。用户可以根据性别、名字风格和灵感来源进行定制,将语言专业知识与创意天赋相结合,确保生成的名字符合个人需求。

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱,支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能,采用传统图像处理与深度学习技术相结合的方式,提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架,支持对相机和物体运动的细粒度控制。它基于3D感知运动表示,结合U-Net架构的扩散模型,实现多种运动相关的视频合成任务,如运动生成、运动克隆、转移和编辑。通过三阶段训练策略,提升运动控制精度和稳定性,适用于影视、游戏、VR/AR、广告及教育等多个领域。

Clickable

Clickable.so 是一种无需花费数小时进行设计和文案写作即可为您的企业制作令人惊叹的广告的方法,它使用人工智能在几秒钟内为所有营销渠道生成广告。