EMNLPSep, 2018
使用均值 - 最大值注意力自编码器学习通用句子表示
Learning Universal Sentence Representations with Mean-Max Attention Autoencoder
Minghua Zhang, Yunfang Wu, Weikang Li, Wei Li
TL;DR本文提出了一种基于均值 - 最大值注意力自编码器的无监督学习模型,它通过 MultiHead 自注意机制和均值 - 最大值策略捕获输入序列的信息,并在大规模无标注数据上进行训练,得到高质量的句子表示,在十种转移学习任务上均超越了其他无监督方法,比传统的循环神经网络训练时间大大缩短。