Apr, 2020

自动从长答案生成问题的研究

TL;DR提出了一种新的评估基准用于评估现有的自动生成问题系统的性能,特别是长文本答案下的自动生成问题系统。研究表明,随着答案长度的增加,现有 AQG 方法的性能显著下降,变压器模型在长答案方面的表现优于其他 AQG 方法,但仍存在性能下降的情况,这表明长答案 QA 是未来研究的具有挑战性的基准任务。