Dec, 2021

基于能量的潜空间的生成视觉 Transformer 用于显著性预测

TL;DR提出了一种基于生成式视觉 transformer 的显著目标检测方法,使用了具有信息能量的先验模型,通过 MCMC 最大似然估计的方法训练视觉 transformer 网络和先验模型,并结合 RGB 和 RGB-D 两种数据进行大量实验,选取更有表现力的能量信息先验,得到了更为准确和人类感知一致的显著性预测和像素级的不确定性地图。