Apr, 2022

单轮辩论不能帮助人类回答困难阅读理解问题

TL;DR针对当前QA系统无法提供合理的解释或证据而生成错误答案的问题,我们提出了一个辩论式的数据集,用于训练模型为两个候选答案提供解释。然而,我们未发现该设置中的解释能够提高人类准确性,但提供人类选择的文本片段则可提高准确度,我们使用这些结论建议未来数据收集工作的改进。