Pyramid-Flow是一款由北京大学、快手科技和北京邮电大学合作研发的先进视频生成模型。该模型能够依据文本提示生成长达10秒、分辨率达1280×768、帧率为24fps的高清视频。其核心技术是创新的金字塔流匹配算法,通过将视频生成过程分解为多个不同分辨率的阶段,在最终阶段以全分辨率进行处理,从而显著降低计算复杂度。此外,Pyramid-Flow采用时间金字塔设计,压缩全分辨率历史信息以提升训练效率,并支持端到端优化,使用单一的统一扩散变换器(DiT)完成训练,简化了模型的实现流程。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部