Jun, 2024

QGEval:一个用于问题生成评估的基准

TL;DR我们提出了一个名为 QGEval 的多维度评估标准,用于对生成的问题和现有的自动评估方法进行评估,涵盖了流畅度、清晰度、简洁度、相关性、一致性、可回答性和回答一致性等七个维度。通过 QGEval 的分析,我们发现大多数问题生成模型在可回答性和回答一致性方面表现不尽人意,并且现有的评估指标无法很好地与人类评估结果相吻合。我们希望这项工作能促进问题生成技术和问题生成自动评估方法的发展。