生成

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。

ClassPoint AI

ClassPoint AI 是一种由 AI 驱动,可从 PowerPoint 幻灯片生成测验问题。它使用先进的人工智能技术来分析幻灯片内容,只需单击一下即可创建发人深省的问题。

Visily

Visily是一款AI驱动的UI设计工具,具备文本到设计、截图转线框图、草图转设计等功能,支持流程图生成及主题风格切换。该工具面向个人开发者、初创公司、产品经理、设计师及教育领域,助力高效设计和团队协作,提升工作效率与设计质量。

Freeflo.ai

Freeflo.ai 是一个多功能的 AI 绘画辅助平台,它通过提供丰富的风格提示词和直观的样例图像,极大地丰富了 AI 绘画的创作可能性。

Stable Video Diffusion

Stable Video Diffusion是一种先进的生成式人工智能视频模型,将图像转换为视频,从而改变了视频生成领域。

MoviiGen 1.1

MoviiGen 1.1是由ZulutionAI推出的专注于生成电影级画质视频的AI模型,基于Wan2.1微调而成。它在氛围营造、镜头运动和物体细节保留方面表现优异,支持720P和1080P分辨率,适用于高保真场景和专业电影应用。模型具备提示扩展功能,可优化生成效果,并采用序列并行与环形注意力等技术提升性能。其应用场景包括电影制作、广告、游戏开发、VR/AR及教育等领域。

Fliki.ai

将文本变成带有 AI 语音的视频,在 2 分钟内使用逼真的声音从脚本或博客文章创建视频!

皮皮动画

各类宣传动画视频轻松做,AI创作,只需简单输入文字(支持中英文),便可根据文案一键生成动画短片,且提供多种声音供你挑选,人物也可以自由更换,轻松生成你想要的动画视频。

QLIP

QLIP是一种基于二进制球形量化(BSQ)的视觉标记化方法,具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略,QLIP可作为视觉编码器或图像标记器,广泛应用于多模态任务,如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率,为统一多模态模型的开发提供了新思路。

Futuretools工具

FutureTools收集并组织了所有最好的AI工具,所以你也可以成为超人!