Leffa(Learning Flow Fields in Attention)是由Meta AI开发的一种用于可控人物图像生成的框架。它通过在注意力机制中引入流场学习,实现对人物外观和姿势的精确控制。Leffa采用正则化损失函数,在训练过程中引导目标查询聚焦于参考图像的关键区域,从而减少细节失真并提升图像质量。该方法无需增加额外参数或推理成本,并可兼容多种扩散模型,展现出较强的模型无关性和泛化能力。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部