ACLMay, 2019

SemBleu: AMR 解析评估的鲁棒度量

TL;DR我们提出了一种名为 SEMBLEU 的强健指标来评估 AMR 解析准确性,并解决了搜索错误问题,该指标在局部和非局部的对应方面都得到了考虑,在句子和语料库级别的初步实验表明,SEMBLEU 与人类判断具有更高的一致性。