论文第一作者余鑫为香港大学博士生,通讯作者为齐晓娟教授,研究方向为生成模型及其在图像和3D的应用。他们提出了一种名为ObjectMover的新模型,能够实现图像中物体的真实感移动、删除和插入,显著提高了图像编辑的真实感和物理一致性。
ObjectMover结合视频扩散模型的强大先验知识,并使用虚幻引擎合成数据进行训练,能够自动同步处理物体的物理效果,如阴影、反射等,解决了现有技术在物体移动、插入和删除时存在的诸多问题。
实验结果显示,ObjectMover在物体移动、删除和插入任务中均取得了明显优于现有方法的图像质量和真实感。