EMNLPOct, 2023

结构化预测的评估度量的统一视角

TL;DR我们提出一个概念框架,统一了不同结构预测任务(例如事件和关系提取,句法和语义解析)的各种评估指标。通过将这些任务的输出表示为某些数据类型的对象,并通过匹配共同子结构,可能跟随标准化,推导出指标。我们演示了如何用这个框架简洁地表达许多任务的常用指标,并显示可以自然地基于输出结构自下而上地推导出新的指标。我们发布了一个库,使得可以派生出新的指标。最后,我们考虑了任务的特定特性如何推动指标设计决策,并建议根据这些动机可能修改现有的指标。