EMNLPApr, 2021

TSDAE: 使用基於 Transformer 的逐步去噪自編碼器進行無監督句子嵌入式學習

TL;DR本研究基于预训练的 Transformer 和序列去噪自编码器(TSDAE)提出了一种新的最先进的无监督方法,该方法表现优于先前的方法高达 6.4 个点。它可以达到领域内监督方法的性能的 93.1%。 此外,我们证明了 TSDAE 是一种强大的领域自适应和预训练方法,明显优于其他方法,如遮蔽语言模型。我们在来自异构领域的四个不同数据集上评估 TSDAE 和其他最近的方法。