EMNLPSep, 2018

使用均值 - 最大值注意力自编码器学习通用句子表示

TL;DR本文提出了一种基于均值 - 最大值注意力自编码器的无监督学习模型,它通过 MultiHead 自注意机制和均值 - 最大值策略捕获输入序列的信息,并在大规模无标注数据上进行训练,得到高质量的句子表示,在十种转移学习任务上均超越了其他无监督方法,比传统的循环神经网络训练时间大大缩短。