Jan, 2024

使用地图接种提高问题回答模型性能

TL;DRQA 模型在解决复杂的和开放性的情境推理问题时,可以通过利用训练数据中的特定模式学习高性能解决方案,但这些模式降低了模型推广到真实世界 QA 问题的能力。通过对 QA 模型进行对抗性挑战测试,我们分析了数据集特征对模型的影响和发生。在已有的减轻数据集特征影响方法的基础上,我们提出了一种名为 “地图疫苗接种” 的新方法,通过在优化的挑战数据子集上微调模型,减少模型对数据集特征的依赖。我们展示了通过有选择地在挑战测试中的模棱两可的对抗性例子上微调模型,可以在整个挑战数据集上取得显著的性能改进,并且对其他具有挑战性的环境和 QA 数据集的模型泛化能力损失最小。