Feb, 2024

D-XCB: 基于 Transformer 的无数据依赖公平准确的网络欺凌检测

TL;DR衡量和减轻基于脱节性联想的粗俗词语和事件之间偏见关联带来的偏见,我们引入了 ID-XCB,这是第一种不依赖数据的去偏技术,结合了对抗训练、偏见约束和去偏微调方法,旨在减轻模型对诱导偏见词语的关注,而不影响整体模型性能。我们在两个常见的基于会话的网络欺凌数据集上探索了 ID-XCB,并进行了全面的消融和泛化研究。我们证明 ID-XCB 具有学习强大的网络欺凌检测能力,并减轻了偏见,其在性能和偏见减轻上优于最先进的去偏方法。我们的定量和定性分析证明其对未知数据的泛化能力。