May, 2022

习惯用语检测的高效样本方法

TL;DR本篇研究旨在探究识别成语化多词表达的高效方法,通过 Pattern Exploit Training 和 BERTRAM 两种少样本分类方法,以及探索不在训练数据中的多词表达的识别,提高英语的表现,但对葡萄牙语和加利西亚语的效果较差。