question answering (QA) systems are sensitive to the many different ways
natural language expresses the same information need. In this paper we turn to
paraphrases as a means of capturing this knowledge and prese
通过评估释义生成方法实现提高 FRANK 问答系统可回答的自然语言问题的多样性,该研究分析了 LC-QuAD 2.0 数据集上的自动度量和人工判断,并讨论了它们之间的相关性,同时对包含错误的数据点进行了错误分析。通过将最佳执行的释义生成方法(一种英 - 法反向翻译)模拟到 FRANK 中进行测试,作者得出两个主要结论:需要清理 LC-QuAD 2.0 数据以消除评估中的错误,而且由于 FRANK 的解析器存在限制,释义生成不是我们可以依赖的一种提高 FRANK 回答自然语言问题多样性的方法。