ECCVDec, 2021

PolyphonicFormer: 深度感知视频全景分割的统一查询学习

TL;DR本文提出了一种称为 PolyphonicFormer 的视觉变换器,它使用查询查询技术将深度估计与全景分割统一起来,具有更好的性能。通过实验证明了我们的方法在深度估计和全景分割方面取得了最先进的结果,并在 ICCV-2021 BMTT 挑战赛中获得了第一名。