ACLFeb, 2024

预测概率的解释:模型置信度还是人工标签变异性?

TL;DR研究纸的主要议题和研究领域是 NLP 系统的不确定性评估,并讨论了预测分布对于模型信心和人类标签变化的指示的两种不同观点,推荐工具和展示了关于预测和人类标签不确定性的解耦表示的令人兴奋的方向。