Nov, 2021

一种概率硬注意模型,用于顺序观察场景

TL;DR本文阐述了一种利用 Bayesian Optimal Experiment Design 来选择信息区域的视觉 Hard Attention Model。通过合成未观察到的区域的特征来预测信息增益(EIG),并在 EIG 最大的位置上实际观察内容。这种模型使用递归特征聚合器维护递归状态,使用线性分类器来预测类别标签,并使用部分变分自编码器来预测未观察到区域的特征。我们使用可微分的目标函数对模型进行训练,并在五个数据集上进行测试。与基线模型相比,当两者只看到几个方向时,我们的模型获得了 2-10%更高的准确度。