Oct, 2020

用人类视觉注意力解释机器阅读理解中的注意力模型

TL;DR通过比较使用不同架构的神经网络在机器阅读理解中的表现,发现与人类视觉注意力较为相似的 LSTM 和 CNN 模型的性能表现显著关联,但与之性能最佳的 XLNet 模型关联性不明显,提示不同架构的神经网络的注意力策略存在差异,且神经注意力与人类注意力相似性并不代表拥有最佳表现。