Feb, 2022

利用对比解释解读语言模型

TL;DR该研究关注对语言模型的对比解释,证明对比解释在验证大型语法现象和改善对相互模拟性上是可量化地更好的,并且可以表征模型在各种语言生成决策中使用的输入令牌。