Apr, 2022

自然语言处理性能评估指标的全球分析

TL;DR本文介绍了自然语言处理领域中用于测量模型性能的度量标准,发现当前使用的大多数指标存在评估不足及解释性差等问题,导致透明性和可重复性的降低。