EMNLPOct, 2022

基于度量的 CAT 探测:解释预训练编程语言模型如何关注代码结构

TL;DR本研究通过提出一种新的 CAT-probing 探针方法,定量解释 CodePTMs 如何关注代码结构,通过过滤编译器预定义的令牌类型的令牌,定义一个新的度量 CAT-score 来衡量令牌级别注意力得分与相应 AST 节点之间的成对距离之间的公共度量,本文证明了 CAT-probing 的有效性。