COLINGFeb, 2024

提高瑞士判决预测的可解释性与公平性:在多语言数据集上进行基准测试

TL;DR对法律判决预测系统中可解释性的评估至关重要,该研究利用瑞士判决预测数据集 (Swiss Judgement Prediction) 研究了多语言 LJP 模型的可解释能力和公平性,并通过全面的支持和反对判决的理由,评估了基于 BERT 的单语言和多语言 LJP 模型的解释性能和预测性能改进的技术。研究结果表明,预测性能的提高并不一定对应于解释性能的增强,强调了从可解释性的角度评估模型的重要性。此外,还引入了一种新的评估框架,即底层法院插入 (Lower Court Insertion),用于量化底层法院信息对模型预测的影响,揭示了当前模型的偏见。