Sep, 2021

评估多跳推理中组合解释的挑战:相关性、完整性和专家评分

TL;DR本研究旨在探讨使用多重推理所产生的解释的评估问题,并提出使用领域专家增强评级来解决。此方法不仅能更好地评估解释的质量,还可以发现之前未被评为优质解释的相关事实,并构建不同方法的模型来评估解释。但实验发现,即使是使用了专家增强的自动评估也会高估模型的性能。