民事诉讼中的法律论证任务
该研究通过比较不同方法,调查了零样本方法在使用三种大型语言模型、两种具有大输入标记尺寸的模型和两种预训练的法律数据模型进行数据分类方面的表现。我们的主要数据集来自美国民事诉讼领域,包括法律案例摘要、具体问题、潜在答案和详细解释,这些都是从一本针对法律学生的书中获取的。通过这些实验,我们的发现展示了大型语言模型的零样本方法如何有效理解复杂数据,我们在实验中取得了最高的 F1 得分,达到了 64%。
Jun, 2024
我们通过使用 GPT4 进行基于提示的解决方案来推理法律论点,同时评估了一系列提示策略的集成,包括思维链推理和上下文学习。在验证数据集上,我们的系统获得了.8095 的宏 F1 值,在最终测试集中排名第 5(21 个团队中)。
Apr, 2024
使用强大的 ChatGPT 模型作为教师模型,通过生成解释和合成数据来扩展训练数据集,并利用生成的数据微调一个小型学生模型。与以往的工作不同,我们的解释不是直接来自教师模型的内部知识,而是基于真实人类分析,从而提供出更优的推理信号。还使用一种新的 “变异” 方法生成受现有数据启发的人工数据实例。我们公开发布这些解释作为原始数据集的扩展,以及用于生成两者的提示。我们的系统在 SemEval 比赛中排名第 15 位。它的性能优于自身教师模型,并且能够生成与原始人类分析一致的解释,经过法律专家验证。
May, 2024
本文介绍了我们在 SemEval 2024 任务 5 中提出的内容:民事诉讼中的法律争议推理任务。我们提出了解决法律答案验证问题的两种方法:首先,对预训练的 BERT 模型进行了微调,并发现基于领域知识训练的模型效果更好;其次,我们对 GPT 模型进行了少样本提示,发现将答案验证任务改为多项选择问题显著提高了模型的性能。我们的最佳模型是基于 BERT 的模型,在 20 个参赛作品中取得了第 7 名。
Apr, 2024
该研究提出了用于日本法律判决预测的首个数据集,即日本侵权案例数据集(JTD),其中包含二个任务:侵权预测和相关性抽取。JTD 基于 41 名法律专家对 3477 个日本民法判决进行了标注,共获得 7978 个实例和 59697 个涉案方的主张。实验结果表明所提出的两个任务的可行性,并且通过法律专家的错误分析确定了错误来源并提出了未来的研究方向。
Dec, 2023
该研究探讨了法律文本中的论点自动提取与语义分析方法,采用基于欧洲人权法院纪录的一种新的注释方案,提出了一种改进的模型,能够更加准确地对法律审判过程中的论点进行自动化提取与分类。
Aug, 2022
本文总结了团队 SCaLAR 在《SemEval-2024 任务 5:民事诉讼中的法律论证》方面的工作。我们提出了一种简单而又新颖的基于相似度和距离的无监督方法来生成标签,以解决该二元分类任务。此外,我们通过使用 CNN、GRU 和 LSTM 等集成特征和多级融合的 Legal-Bert 嵌入来探索解决法律文本复杂性的问题。为了解决数据集中冗长的法律解释,我们引入了基于 T5 的分段摘要,成功保留了关键信息,提高了模型的性能。我们的无监督系统在开发集上的宏 F1 得分增加了 20 个百分点,在测试集上增加了 10 个百分点,这是一个令人鼓舞的结果,考虑到其简单的架构。
Mar, 2024
对于模拟法律推理和案例论证以支持决策的论文进行了回顾,揭示了传统符号逻辑与 AI 技术,并探讨了在法律自然语言处理方面的最新进展,提出融入专家知识以在符号逻辑和数据驱动方法中保持可拓展性和解释性的可能性,同时识别出挑战和现代自然语言处理模型和方法的潜力。
Jun, 2024
本文对传统词嵌入模型与 BERT 模型在人权法庭裁决文本的法条分析任务中的表现进行了比较,实验证明领域特定的 BERT 模型有很大的潜力,而传统的词嵌入模型在与神经网络层结合后也能表现出很强的性能。
Feb, 2022
该论文探讨了 Legal NLP 领域的研究,分析了 SemEval 举办的 LegalEval 任务的三个子任务:语言角色标注,法律实体识别和法院判例预测,并总结了 26 个团队的研究成果。
Apr, 2023