COLINGJun, 2018

用于复述识别、语义文本相似性、自然语言推理和问答的神经网络模型

TL;DR本文分析了几种神经网络设计(及其变体),对八个数据集进行了广泛的比较,包括释义识别、语义文本相似性、自然语言推断和问题回答等任务。我们提供了一个系统的研究,表明编码上下文信息的 LSTM 和句间交互至关重要,而 Tree-LSTM 并不能像先前宣传的那样有所帮助,但却出人意料地提高了 Twitter 数据集的性能;增强顺序推理模型是迄今为止较大数据集的最佳选择,而基于词对交互的模型在较少数据可用时实现最佳性能。我们将我们的实现作为开源工具包发布。