Oct, 2022

InforMask: 语言模型预训练的无监督信息遮蔽

TL;DR本文提出了 InforMask 方法,使用点互信息(PMI)来选择最具信息量的 tokens 进行蒙版,并进行两种优化以提高效率,该方法在 LAMA 和 SQuAD v1、v2 基准测试上明显优于随机蒙版和以前提出的蒙版策略。