BriefGPT.xyz
Feb, 2024
用非线性力量击打“探测性”及更多
Hitting "Probe"rty with Non-Linearity, and More
HTML
PDF
Avik Pal, Madhura Pawar
TL;DR
通过使用非线性结构探测器来研究编码信息的结构特点,这篇论文提出了一种简化而有效的非线性结构探测器设计,并设计了一个可视化框架来定性地评估句子中两个词之间的连接强度,并用于探索BERT在各层中编码的依赖关系树的结构。研究发现,径向基函数(RBF)比线性探测器对BERT模型更有效。
Abstract
structural probes
learn a linear transformation to find how
dependency trees
are embedded in the hidden states of language models. This simple design may not allow for full exploitation of the structure of the en
→