ACLApr, 2022

数据集平衡的局限性:对抗虚假相关的失败战役

TL;DR本观点文章指出,解决数据集平衡问题的常见方法已经不足以避免深度学习模型对小规模数据和特定标签的依赖和过拟合问题。我们提出了多种替代方法,包括增强数据集上下文语境,使用少量样本训练模型,通过与用户交互的方式进行模型推理等。