Jul, 2020

CrossTransformers: 空间感知的少样本迁移

TL;DR本文研究了现代视觉系统的表现下降原因:监督学习时神经网络模型表示出现了监督崩溃现象,即模型丢失了一些与训练任务无关但对多任务或多领域转移有用的信息。作者提出了两种方法来缓解该问题:一是利用自监视学习以鼓励更通用的特征,二是提出了一种新型的基于 Transformer 的神经网络结构 CrossTransformers,可以用少量标记图像和无标记查询项,找到查询项与标记图像之间的粗略空间对应关系,从而通过计算空间对应特征之间的距离来推断其分类。结果是得到一个更加适应任务和领域转移的分类器,证明了在 Meta-Dataset 上的最新成果。