Add-it是由NVIDIA开发的一项创新图像编辑技术,能够通过文本指令在图像中无缝添加对象,而无需进行专门的模型训练。该技术基于扩展的扩散模型,利用注意力机制整合场景图像、文本提示及生成图像的信息,确保新增对象与原始场景的结构一致性及自然融合。在多项基准测试中,Add-it的表现超越了传统的监督学习方法,并获得了超过80%的人类偏好评分。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部