EMNLPOct, 2023

预训练的语言模型是否学习到了法人实体类型?

TL;DR研究了语言模型在领域特定知识的获取和法律知识评估任务,比较了不同类型、长度和语义或语法信号的实体,不同语言模型预训练语料库和架构对于实体类型的性能影响,并发现 Llama2 在优化提示模板后表现良好,法律导向的语言模型显示性能不一致,存在的问题包括多令牌实体以及法律子领域实体的识别,此外 Llama2 在识别句法信号上存在缺陷,相较于基于 BERT 的架构缺陷更为显著。