EMNLPDec, 2021

重新思考作者验证实验设置

TL;DR本文提出了五个新的公共分组来隔离和识别与文本主题和作者书写风格相关的偏差,并使用可解释的 AI 发现这些基线模型存在命名实体偏差,进而得出释放命名实体的模型在作者验证中更好的结果和更好的泛化能力,这对与 PAN 大规模作者验证数据集有重要意义。