Sep, 2023

剑桥法律语料库:法律人工智能研究的语料库

TL;DR介绍了剑桥法律语料库(CLC),这是一个用于法律人工智能研究的语料库。该语料库包括超过 25 万个来自英国的法庭判例,涵盖了从 16 世纪至 21 世纪的案件。该论文介绍了该语料库的第一个版本,并提供 638 个案例的案件结果注释,以作为使用 GPT-3、GPT-4 和 RoBERTa 模型进行案件结果提取的基准。该论文还包括了广泛的法律和伦理讨论,以解决这一材料可能具有的敏感性。因此,该语料库仅在特定限制下释放供研究目的使用。