ACLFeb, 2022

用串行再现链探究 BERT 的先验知识

TL;DR本文在认知科学的迭代学习理论的基础上,探索利用串行复制链从 BERT 先验中抽取样本,发现 Generative Stochastic Network(GSN)采样器是地面真实联合分布的唯一一致估计器,其从 GSN 链产生的句子的词汇和句法统计数据与地面真实语料库分布密切匹配,并在大量自然性判断中表现比其他方法更好,从而为从底层开始探测创新奠定了更牢固的理论基础。