Mar, 2023

Transformer 模型是否在预测被遮盖的单词时进行解析?

TL;DR本研究调查了预训练语言模型是否实际执行语法分析任务或仅弱相关运算,通过生成建模与 PCFG 结构的实验,证明了模型可以近似执行该任务并恢复算法估计的概率。