ACLApr, 2017

具有注意力机制的循环神经网络用于识别中文隐含语篇关系

TL;DR本研究提出了一种基于注意力机制的双向长短时记忆网络模型,将论述关系的参数组合作为一个联合序列来模拟可以胜过不考虑词序的方法。我们的模型采用了部分采样方案,概念上简单,但是在中文语境的论语树库中取得了最先进的性能,我们还通过可视化其注意力机制的活动状态,说明了该模型在选择性关注输入序列相关部分方面的能力。