视频生成

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具,利用先进的扩散Transformer技术和2亿参数的DiT架构,能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性,适用于游戏、广告、影视等多种行业,为用户提供高效的视频生成解决方案。

Hailuo AI

Hailuo AI 是一款基于AI技术的视频生成工具,支持将文本和图片转化为动态视频内容。提供多种艺术风格与场景选择,最新模型可让2D插画动起来,适用于创意设计、影视制作等领域,帮助用户高效实现视觉创意,提升创作效率。

Revid AI

Revid AI 是一款AI驱动的视频生成工具,支持从脚本创作到视频发布的全流程操作。用户可输入创意自动生成视频内容,涵盖多种风格与语言模板,具备简单易用的编辑功能及一键发布能力。适用于社交媒体、品牌营销、教育分享及电商展示等多个场景,提升内容创作效率与传播效果。

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架,支持图像、音频、视频和文本等多种输入条件,生成高质量定制化视频。采用文本-图像融合与图像ID增强技术,提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景,具备音频驱动和视频驱动两种生成方式,展现强大可控性与灵活性。

Quinvio AI

Quinvio AI提供了一个创新的演示文稿制作平台,它通过AI技术简化了演示文稿的制作过程,使用户能够快速、轻松地创建专业的演示文稿,而无需专业的设计或技术技能。

Lipsync

Lipsync-2 是 Sync Labs 推出的全球首个零样本嘴型同步模型,无需预训练即可快速生成符合说话者风格的嘴型动作。支持多语言、个性化表达和温度参数调节,具备高精度、高真实感和高效处理能力,广泛应用于视频翻译、动画制作、多语言教育及 AI 内容生成等领域。

Dream Machine

Dream Machine是Luma AI开发的AI视频生成模型,能够快速将文本和图像转换为高质量、逼真的视频。Dream Machine可以在120秒内生成120帧视频,具备流畅的运动、电影摄影和戏剧效果。...

TheoremExplainAgent

TheoremExplainAgent(TEA)是一款基于多模态技术的AI工具,可生成超过5分钟的数学与科学定理解释视频,涵盖多个STEM领域。它结合文本、动画和语音,提升抽象概念的理解效果,并具备自动错误诊断功能。通过TheoremExplainBench基准评估,TEA在准确性、逻辑性和视觉表现上均表现优异,适用于在线教育、课堂教学和学术研究等多种场景。

HelloMeme

HelloMeme是一款基于扩散生成技术的框架,专注于表情与姿态迁移。它利用空间编织注意力机制与Stable Diffusion 1.5模型的结合,生成自然且物理合理的表情包视频,同时具备强大的泛化能力和扩展潜力。HelloMeme通过模块化设计实现了高效的表情和姿态迁移,适用于多种应用场景,如社交媒体内容创作、视频娱乐、电影制作、广告营销及教育培训等。