ACLJan, 2021

亚里士多德是否使用过笔记本电脑?具有隐式推理策略的问答基准测试

TL;DR本研究提出了一个策略问答(QA)基准,其中隐含着应该使用一种策略来推理出问题的答案,包括一个包含 2,780 个示例的数据集,该数据集使用词语引导的数据收集方式以激发众包工人,控制注释器群体和通过构建对抗过滤器消除推理快捷方式来实现。分析结果表明,StrategyQA 中的问题简短,涵盖了广泛的主题和策略,并显示出人类表现良好。