COLINGSep, 2022
更多数据是否更好?重新思考基于 Transformer 主动学习模型中滥用语言检测效率的重要性
Is More Data Better? Re-thinking the Importance of Efficiency in Abusive Language Detection with Transformers-Based Active Learning
Hannah Rose Kirk, Bertie Vidgen, Scott A. Hale
TL;DR使用模拟实验展示 transformer 主动学习方法能够显著提高数据效率,同时保持高效性,特别适用于滥用内容较小的数据集。