SIGIRJun, 2021

低资源机器阅读的简单有效数据增强方法:物美价廉还是一分价钱一分货?

TL;DR这篇研究提出了一种简单有效的数据增强策略,可以帮助低资源情况下的机器阅读理解(MRC)系统更好地预训练答案提取组件。该方法的核心在于,首先采用包含正确答案的近似上下文的数据对 MRC 系统的答案提取部件进行预训练,然后再对确切答案进行训练。实验表明,这种策略可以提高系统的检索和答案提取性能。