Mar, 2024

构建多层次摘要的无监督法律文本问答系统

TL;DR本文总结了团队 SCaLAR 在《SemEval-2024 任务 5:民事诉讼中的法律论证》方面的工作。我们提出了一种简单而又新颖的基于相似度和距离的无监督方法来生成标签,以解决该二元分类任务。此外,我们通过使用 CNN、GRU 和 LSTM 等集成特征和多级融合的 Legal-Bert 嵌入来探索解决法律文本复杂性的问题。为了解决数据集中冗长的法律解释,我们引入了基于 T5 的分段摘要,成功保留了关键信息,提高了模型的性能。我们的无监督系统在开发集上的宏 F1 得分增加了 20 个百分点,在测试集上增加了 10 个百分点,这是一个令人鼓舞的结果,考虑到其简单的架构。