Oct, 2023

可衡量忠诚度的遮蔽语言模型

TL;DR提议基于掩码方法的一种内在的可靠度可衡量模型,该模型能够解决现有方法受限、计算昂贵且基于代理模型的问题,通过在设计上使掩码令牌成为数据分布内的方式,从而能够更有效地解释和说明 NLP 模型。