Dec, 2023

语言模型作为注释器:无监督的上下文感知质量词组生成

TL;DR本文提出了LMPhrase,一个建立在大型预训练语言模型(LMs)之上的新型无监督上下文感知的高质量短语挖掘框架,通过应用一种无参数的探测技术,首先利用预训练语言模型BERT进行标记获得银标签的高质量短语,然后将短语标记任务形式化为序列生成问题,通过在预训练语言模型BART上进行直接微调以生成预测结果,并将标记和生成的短语结合作为最终的预测结果,在两个不同领域的短语挖掘任务中,LMPhrase始终优于现有竞争对手。