Jun, 2024

GiusBERTo: 意大利审计法院决定中的个人数据去识别的法律语言模型

TL;DRGiusBERTo是基于BERT模型的首个专用于匿名化意大利法律文件中个人数据的模型,通过在大规模审计法院决定数据集上训练,它能识别需要匿名化的实体,包括姓名、日期和地点,同时保持上下文相关性,并在测试集上实现了97%的标记级准确率,为意大利法律社区提供了一种平衡隐私和数据保护的准确而定制的BERT模型。