Jun, 2024

DICE:从单一图像捕捉手脸互动的端到端变形

TL;DRDICE 是一种基于 Transformer 的全新的、从单张图像中重建具有变形的手 - 脸互动的方法,其特点是通过将本地变形场和全局网格顶点位置的回归分离到两个网络分支,从而增强精确而稳健的手 - 脸网格恢复中的变形和接触估计。我们的实验表明,在基准测试和野外数据方面,DICE 在准确性和物理合理性方面均达到了最先进的性能水平。此外,我们的方法在 Nvidia 4090 GPU 上以交互速率(20fps)运行,而 Decaf 则需要超过 15 秒处理一张图像。