Sep, 2023

大型非结构化法律文件中的分类与解释的分层神经框架

TL;DR对于长达数万字、结构不均匀的案例文件,自动法律判决预测及其解释存在困难。本研究使用称为 MESc 的深度学习分类框架,通过定义 “缺少结构化信息的法律文档” 问题,尝试从这些缺少结构标注的长文档中提取解释。同时,我们还研究了拥有数十亿参数的大型语言模型(GPT-Neo 和 GPT-J)在法律文本和领域内迁移学习方面的适应性,并将其性能与 MESc 及其最后层嵌入的组合进行了比较。对于这种层次模型,我们提出了一种名为 ORSE 的解释提取算法,即基于遮蔽敏感性的相关句子提取器。