Mar, 2023

学生t分布:关于在观测值稀缺时度量评分者间可靠性的研究

TL;DR本文介绍如何在缺少数据的情况下,使用学生t分布法来评估自然语言处理领域中翻译质量评估(TQE)任务中的人工评测可靠性(IRR),并进一步分析在数据量较少时如何提高评测的置信度。