重新思考作者验证实验设置

EMNLPDec, 2021

Rethinking the Authorship Verification Experimental Setups

Florin Brad, Andrei Manolache, Elena Burceanu, Antonio Barbalau, Radu Ionescu...

TL;DR本文提出了五个新的公共分组来隔离和识别与文本主题和作者书写风格相关的偏差，并使用可解释的 AI 发现这些基线模型存在命名实体偏差，进而得出释放命名实体的模型在作者验证中更好的结果和更好的泛化能力，这对与 PAN 大规模作者验证数据集有重要意义。

Abstract

One of the main drivers of the recent advances in authorship verification is the PAN large-scale authorship dataset. Despite generating significant progress in the field, inconsistent performance differences between the closed and open test sets have been reported. To this end, we impr

authorship verification pan dataset bert-like models text topic writing style

发现论文，激发创造

关于作者归属与作者验证方面现有技术的状况

该研究论文介绍了谁是这篇文章作者（AA）和作者验证（AV）这两种方法，针对 AA/AV 数据集和评估指标的标准化与基准评估并评估了八种方法，其中传统的 Ngram-based 模型在 5 个 AA 任务中表现最佳，而 BERT-based 模型则在另外两个任务和 AV 任务中表现更好。通过使用 hard-negative mining，AV 方法可以作为 AA 方法的有竞争力的替代品。

Sep, 2022

VeriDark: 暗网上的作者验证大规模基准

本研究旨在构建一个针对网络犯罪的基准测试集 VeriDark，并对三个大规模数据集和一个用户行为数据集进行竞争性 NLP 基线评估及预测分析，以解决现有基于文学文本的作者识别方法无法适用于网络犯罪，且当前缺乏合适数据集和实验设计的问题。

Jul, 2022

基于深度学习的双盲审稿破解：作者归属性鉴定

该研究提出了一种基于变形金刚模型的神经网络结构，仅使用文本内容和参考文献中的作者姓名来将匿名稿件归属于作者，并创建了迄今为止最大的作者身份识别数据集，并发现了双盲审稿流程中的一些弱点，为支持公正的双盲审稿流程提供了有价值的见解。

Nov, 2022

基于 BERT 的罗马尼亚语数据集 ROST 的作者归属

使用预训练的语言模型 BERT 来检测罗马尼亚语文本的作者，虽然数据集不平衡，但结果比预期好，有时超过 87％的宏平均精度。

Jan, 2023

不可靠新闻检测数据集中的隐性偏见

本文研究了自动检测不可靠新闻的问题和如何创建更可靠的数据集，发现大规模新闻数据集存在选择性偏差和混淆因素，导致模型的表现不稳定，提出了创建更可靠的数据集的建议。

Apr, 2021

我们需要谈论随机分割

研究指出，NLP 领域的实验应当使用多重的、独立的测试集进行评估，以获得更真实的性能评估；当不可能使用多个测试集时，使用多个有偏差的划分方式可得到更接近真实的性能评估。

May, 2020

训练集以外的事实核查

我们提出了针对事实检查领域的常见问题的改进算法，包括对传统的 retriever-reader 模型的性能下降问题的改进，以及对 reader 组件的改进，通过对 claims 和 evidence documents 的无序性进行训练，从而提高对分布偏移的鲁棒性。此外，我们还提出了一种自动方法来构建多主题事实检查数据集，并将我们的模型与一组强大的基准模型进行比较。

Mar, 2024

构建稳健且保护隐私的文本表现

本文提出了一种明确遮蔽作者特征的方法，使训练后的表示对这些属性不变，以便在两个任务中评估，表明这导致所学表示的隐私性增强，以及更强大的模型应对不同的评估条件，包括领域外语料库。

May, 2018

CAVE: 可控作者验证解释

通过预训练模型 CAVE，我们能够生成结构化且可验证的作者身份验证（AV）解释，这对于高风险应用中的实际应用非常重要，同时保持较高的任务准确性。

Jun, 2024

不走捷径：基于集成的方法避免已知数据集偏差

本文提出了一种训练出更具有领域迁移鲁棒性的模型的方法，通过训练一个简单模型以识别数据集偏差，再与鲁棒模型结合，使其更专注于数据集中更容易推广的模式。在五个具有领域迁移测试集的数据集上实验，结果显示在所有情况下都有显著改善，包括一个变化优先视觉问答数据集上的 12 点增益和一个对抗问答测试集上的 9 点增益。

Sep, 2019