Dec, 2022

掩码语言模型所学习条件句的不一致性

TL;DR此篇研究发现遮蔽语言模型中双向条件的不一致性,尤其在 T5 和 BERT 模型的二元模型中表现得十分显著。这些不一致性可能影响基于 BERT 模式的 MLMs 的序列采样研究,同时也意味着具有相似功能的 T5 式 MLMs 会基于不同遮蔽数量产生差异。