Jan, 2024

学习高品质和通用性的短语表示

TL;DR我们提出了一个改进的框架来以无上下文的方式学习短语表示, 该框架使用短语类型分类作为辅助任务, 并更有效地将字符级信息融入短语表示, 通过设计三种不同程度的数据增强来增加训练样本的多样性, 我们的实验结果表明, 相对于先前的方法, 我们的方法生成了更优秀的短语嵌入, 同时还需要更小的模型大小。