Feb, 2023

无 PPA:非参数成对注意力随机游走模型的句子表示

TL;DR提出一种名为 NoPPA 的新型非参数 / 不可训练语言模型,只使用预训练词嵌入和预计数词频来生成句子嵌入,并通过非参数的注意机制打破袋装词语假设的限制。在八个不同的下游分类任务上验证,实验结果显示 NoPPA 在每个数据集上均优于所有基于长袋的方法,并在平均性能上提供与最先进的非参数方法相当或更好的性能。此外,可视化证实了 NoPPA 能理解上下文主题、常用短语和词语因果关系。