VideoWorld VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。 AI项目与工具 2025年06月12日 66 点赞 0 评论 388 浏览
智影AI 智影AI是一款云端智能视频创作工具,依托大模型底座技术的AI绘画推文神器,零基础小白也能轻松上手,快速实现从文案到视频的制作。 Ai视频生成 1970年01月01日 0 点赞 0 评论 390 浏览
ConceptMaster ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架,可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型,有效解决身份解耦问题,尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试,适用于视频创作、动画制作、游戏开发及产品展示等领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 391 浏览
VideoGrain VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。 AI项目与工具 2025年06月12日 99 点赞 0 评论 391 浏览
Tora Tora是阿里推出的一个强大的视频生成工具,它通过集成多种条件来创造高质量的视频内容。其主要优势在于对运动轨迹的精确控制和对物理世界运动的真实模拟,这使得Tora在视频内容创... Ai视频生成 1970年01月01日 0 点赞 0 评论 392 浏览
Vidu Q1 Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型,支持1080p高清视频生成,具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异,包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构,融合文本、图像和视频信息,适用于影视制作、广告宣传及动画创作等领域。 AI项目与工具 2025年06月12日 96 点赞 0 评论 392 浏览
DisPose DisPose是一项由多家顶尖高校联合研发的技术,专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式,结合混合ControlNet模块,实现了对骨骼姿态的有效控制,无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。 AI项目与工具 2025年06月12日 36 点赞 0 评论 393 浏览
HumanDiT HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。 AI项目与工具 2025年06月12日 41 点赞 0 评论 394 浏览
Deforum 一款开源免费软件工具,一种基于Stable Diffusion的动画生成工具,它可以根据文本描述或参考视频生成连续的图像序列,并将它们拼接在一起以创建视频。 Ai视频生成 2025年06月05日 51 点赞 0 评论 397 浏览