BriefGPT.xyz
大模型
Ask
alpha
关键词
self-attention vectors
搜索结果 - 1
ACL
打开西门子:深入探讨 BERT 的语言知识
本文探讨了 BERT 对句法层次结构、位置信息以及自注意力向量的编码,并发现 BERT 在较低的层次上良好地编码了位置信息,在较高的层次上则更倾向于编码层次结构,这表明 BERT 的表示法确实模拟了语言的一些层次结构,并且对于处理反身代词的
→
PDF
5 years ago
Prev
Next