Feb, 2024

透过分裂投票的镜头:探索法律案件结果分类中的分歧、难度和校准

TL;DR法律决策中的分裂投票在处理多样化的法律论点和意见时给律师带来困难。了解人类与 AI 系统之间知觉难度的一致性对于建立信任至关重要。然而,现有的 NLP 校准方法重点关注分类器对预测性能的意识,忽视了人类标签变化的固有性。本文探讨了分裂投票作为自然可观察的人类分歧和价值多元主义现象。我们从欧洲人权法院 (ECHR) 收集法官的投票分布,并提出了 SV-ECHR,一个带有分裂投票信息的案件结果分类数据集。我们建立了与分裂投票相关的异议分类体系,并进一步评估了模型和人类之间知觉难度的一致性,以及案件结果分类模型的置信度和人类标定。我们观察到模型与法官投票分布的一致性有限。据我们所知,这是首次系统探索在法律 NLP 中校准人类判断的研究。我们的研究强调了在法律决策任务中测量和提升模型校准,考虑人类标签变化的必要性。