May, 2022

基于 Transformer 的知识归属模式挖掘

TL;DR本文研究了 Knowledge Neurons 框架的知识神经元以及它们在 Transformer 网络中对于事实和关系知识的归因。研究发现,大多数的事实知识可以归属于网络的中高层。而中间层次则更多负责关系信息,最后数层则进一步提炼成实际的事实知识或 “正确答案”。此外,本文的实验还表明,该模型可处理不同语言的提示,但提供了类似的信息,进一步证明了多语言预训练技术的有效性。研究还将归属方案应用于语法知识,发现语法知识比事实知识更为分散。