Sep, 2021

提取、整合、竞争:朝着验证式阅读理解发展

TL;DR本文介绍了一个名为VGaokao的新验证样式阅读理解数据集,它来自高考的中文语言测试。与现有的努力不同,该数据集最初是为母语人士的评估而设计的,因此需要更先进的语言理解技能。为了解决VGaokao中的挑战,我们提出了一种新颖的提取-集成-竞争方法,它使用一种新的查询更新机制,不断选择互补证据,并自适应地提取支持性证据,随后通过配对竞争来推动模型学习类似文本片段之间的微妙差异。实验表明,在检索到互补证据的情况下,我们的方法在VGaokao上优于各种基线,并具有效率和可解释性的优点。我们的数据集和代码已发布以供进一步研究。