Apr, 2022

基于一致性约束的序列Transformer关注模型在部分可观测场景中的应用

TL;DR本文提出序列转换器关注模型(STAM),以在资源有限的情况下,部分观察完整图像并仅基于过去的瞥见预测信息突出位置。使用DeiT-distilled设计代理并使用一步演员-评论家算法进行培训。此外,为了提高分类性能,还介绍了一种新的培训目标,该目标强制要求完整图像中由教师模型预测的类分布与使用瞥见预测的类分布之间的一致性。在观测图像总面积仅为4%的情况下,引入一致性损失的训练目标在ImageNet和fMoW数据集上分别提高了3%和8%的准确性。此外,在ImageNet和fMoW上观察到的像素数量减少了近27%和42%。