May, 2023

ESCOXLM-R: 面向职场领域的多语言基于分类法的预训练

TL;DR该研究引入了 ESCOXLM-R 语言模型,基于 XLM-R 进行领域自适应预训练,并使用 ESCO 定义了动态掩码语言建模和诱导跨语言 ESCO 类别关系的目标,实现了在 4 种语言的 6 个序列标记和 3 种分类任务上的国内领先性能,并发现其在短跨度上表现更好,并且在实体级和表面级跨度 F1 上优于 XLM-R,可能是由于 ESCO 包含短技能和职业标题,并编码实体级信息的原因。