ICLRDec, 2014

细粒度分类中的注意力

TL;DR本文在 Ba 等人(2014)的循环神经模型的基础上进行实验,研究了在不受约束的视觉环境下细粒度分类的任务,通过使用较强的视觉网络替代传统的 RNN 结构,并在视觉网络的大规模预训练的情况下训练该模型,成功实现比谷歌网络分类模型更好的效果,并表明该模型能够无需边界框等空间监督,自主学习并区分各类狗的品种,具备对端对端的训练等优势。