EMNLPMay, 2022

GPT-2 中的花园路遍历

TL;DR本研究提出了一系列分析 GPT-2 内部状态的方法,并以对花园路径句子的遍历作为案例研究,使用最大的可用数据集编译了花园路径句子,并展示了曼哈顿距离和余弦相似性提供了比分析下一个标记概率更可靠的见解。通过这些方法,研究发现否定标记对动词对象明确的句子的表示影响较小,而对语态造成歧义的明确句子的表示影响更大。研究还发现分析解码器模型的隐藏状态揭示了可能会产生花园路径效应的歧义期,而惊奇分析通常会忽略这一细节。