Sep, 2022

通过因果中介分析测试预训练语言模型对分配律的理解

TL;DR本文介绍了一个新的自然语言推理诊断数据集 DistNLI,旨在研究分配性带来的语义差异,运用因果中介分析框架量化模型行为并探索其中的机制,发现模型对此高层次语义知识的理解程度与模型大小和词汇表大小相关,并提出了模型如何编码此类高层次语义知识的见解。