Oct, 2017

多层注意力机制在机器阅读理解中的应用

TL;DR本研究提出了一种名为 PhaseCond 的多层关键词模型,其中包含多个实现通道表示和信息流调节的关注层堆栈和内部或外部融合层堆栈,并通过同时对来自不同角度的多个问题和通道嵌入层进行编码来扩展和改进 PhaseCond 的点积关注函数,结果表明该模型在 SQuAD 数据集上明显优于单层和多层注意模型。