Dec, 2023

探索具有层次性质的预训练语言模型

TL;DR这篇论文提出了一种能够评估预训练语言模型在捕捉复杂的分类关系方面能力的无任务评估方法,并通过实验证明预训练语言模型隐式编码的词汇-语义知识并未始终捕捉到层次关系。此外,作者进一步展示了注入这种评估方法能够改善预训练语言模型对层次关系的理解,并通过对分类体系重构、上位词发现和阅读理解任务的评估表明,层次结构的知识在不同任务间有一定的但不系统的传递性。