EMNLPNov, 2023

滨近风险最小化在滥用语言检测中的少样本跨语言转移

TL;DR通过数据增强和持续的预训练,我们改善了跨语言辱骂语言检测的领域适应。数据增强策略对多领域和多语言环境下的零样本跨语言辱骂语言检测具有显著提升作用。然而,领域适应会有利于辱骂文本类的检测(降低误报),但同时也会降低辱骂语言检测模型的精确性。