Dec, 2023

HOI-Diff: 使用扩散模型基于文本驱动合成的三维人 - 物交互

TL;DR我们研究了通过文本指令生成逼真的三维人 - 物互动问题。我们采用模块化设计,将复杂任务分解为简单子任务。我们开发了双分支扩散模型(HOI-DM)来生成人和物体的动作,并通过人和物体动作生成分支之间的交叉注意力通信模块来促进一致的动作。我们还开发了互动预测扩散模型(APDM)来预测通过文本指令驱动的人和物体之间的接触区域。APDM 相对于 HOI-DM 结果是独立的,并且可以纠正后者的潜在错误。此外,它可以随机生成接触点,以多样化生成的动作。最后,我们将估计的接触点合并到分类器引导中,实现准确和密切的人与物之间的接触。通过注释 BEHAVE 数据集的文本描述来训练和评估我们的方法。实验结果表明,我们的方法能够产生具有各种互动和不同类型物体的逼真的人 - 物互动。