ACLApr, 2021

ExplainaBoard: 一个针对 NLP 的可解释排行榜

TL;DR本文提出了一种新的 NLP 评估概念和实现,即 ExplainaBoard,它不仅继承标准排行榜的功能,还允许研究人员诊断单个系统的优势和劣势,解释多个系统之间的关系,并仔细检查预测结果。此外,这篇论文还将评估工具制作成了 API,使用户可以离线方便地评估其模型。