EMNLPSep, 2021

无监督上下文化文档表示

TL;DR该研究提出一种简单而有效的无监督表示方法 SCDV+BERT (ctxd),通过结合上下文化的 BERT 方法和 SCDV 软聚类方法来处理单义和上下文特性的词语。研究表明,在多项分类数据集和概念匹配和句子相似性等任务中,此嵌入方法的性能优于原始 SCDV、预训练 BERT 和其他基线模型,尤其在数据稀缺和少样本学习任务中比微调 BERT 和不同嵌入方法表现更好。