Jul, 2017

通过注意力机制提炼原始句子表示,用于文本蕴含识别

TL;DR用 bidirectional LSTM 将一对句子分别编码成变长表示,再通过简单聚合函数创建固定长度的未经处理的表示。接着使用注意机制对这些表示进行细化处理。最后,将两个句子的细化表示相结合成为一个用于分类的向量,并且使用集成方法来提高模型的准确性,最终比 LSTM 基线表现更好,类似于 ESIM 模型的表现。