Oct, 2023

视觉注意引导的预测与学习

TL;DRVisual Attention-Prompted Prediction and Learning是一种新的框架,可以将视觉关注提示无缝地融入模型的决策过程,并适应具有和没有关注提示的图像进行预测。为了解决视觉关注提示的不完整信息问题,我们引入了基于扰动的关注图修改方法,并提出了一种优化的蒙版聚合方法以及新的权重学习函数,以适应关注图修改过程中的自适应扰动标注聚合。我们的整体框架是为了在多任务的关注提示引导下学习,以提高未提供关注提示的样本的未来预测能力,并通过交替训练的方式来获得更好的收敛性。在两个数据集上进行的大量实验证明了我们提出的框架在增强具有和无关注提示的样本的预测能力方面的有效性。