Nov, 2023

使用正确性判别器预测泛化性能

TL;DR通过训练鉴别器来预测 NLP 模型在未见过的可能不同分布的数据上的准确性,从而得到一个上下界,无需使用未见过数据的真实标签。通过多个任务的实验证明了真实准确性在预测的上下界之间,并且这些上下界非常接近。