Sep, 2022

全景视觉Transformer用于360度视频显著性检测

TL;DR本文提出了一种名为Panoramic Vision Transformer(PAVER)的新框架,能够使用Vision Transformer结合可变形卷积从360度视频的局部特征中学习视觉显著性,从而在Wild360基准测试上显著优于其他先进模型,无需监督或辅助信息。