通过图神经网络增强法规条款检索的搜索能力

ACLJan, 2023

通过图神经网络增强法规条款检索的搜索能力

Finding the Law: Enhancing Statutory Article Retrieval via Graph Neural Networks

Antoine Louis, Gijs van Dijck, Gerasimos Spanakis

TL;DR本文提出一种结合了法律文本组织结构的图神经网络模型，通过稠密检索来检索法规文章，该方法有效提高了检索性能。

Abstract

statutory article retrieval (SAR), the task of retrieving statute law articles relevant to a legal question, is a promising application of legal text processing. In particular, high-quality SAR systems can improve the work efficiency of legal professionals and provide basic legal assis

statutory article retrieval legal text processing graph neural network dense retrieval sar dataset

发现论文，激发创造

一份法语法规条文检索数据集

介绍了比利时法规文章检索数据集（BSARD），同时在该数据集上评测了几种最先进的检索算法，发现精调密集检索模型显著优于其他系统，最终在该数据集任务中取得了 74.8% R@100 的良好成绩。

Aug, 2021

STARD：一个包括非专业人员发出的真实查询的中文法规检索数据集

为了填补现有法律查询数据集对非专业用户提出的实际查询的不足，本文引入了 STAtute Retrieval Dataset（STARD），该数据集由 1543 个来自现实世界法律咨询的查询案例和 55348 个候选法规文章组成，并通过对各种检索基线模型进行综合评估，揭示了现有检索方法在非专业用户提交的实际查询中的不足，为进一步探索和研究提供了必要性。

Jun, 2024

GPT-3 是否能够进行法定推理？

本文探索了最强大的 GPT-3 模型 ——text-davinci-003，在一个已建立的立法推理数据集 SARA 上的能力，并尝试了各种方法，包括动态少量提示、思维链提示和零提示。尽管我们在 GPT-3 中取得了优于以前发表的最佳结果的成果，但我们也发现了它的一些明显错误。通过研究为什么会出现这些错误，我们发现 GPT-3 对 SARA 基于的实际美国法规的先前知识有所欠缺。更重要的是，GPT-3 在回答有关简单的合成法规的直接问题时表现不佳。当将合成法规用句子形式书写时，提出相同的问题，我们发现 GPT-3 的一些差的表现是由难以解析通常包含子节和段落结构的法规的典型结构造成的。

Feb, 2023

税法蕴涵推理与问答的法规推理数据集

研究表明，直接应用机器阅读模型在条例推理过程中的性能不佳，需要通过解决法律领域的挑战来发展在自然语言处理上的模型。

May, 2020

LeSICiN：一种基于异构图的自动化印度法律文件法规识别方法

本研究提出了一种名为 LeSICiN 的模型，将法律引文网络和文本内容结合起来，成功地实现了对印度刑事法典（IPC）案例中存在的法律法规进行识别。通过对包含多个印度法院案件的案例事实和 IPC 法规的数据集进行实验，证实了该模型在法律条款识别任务上表现优越。

Dec, 2021

图神经网络增强的 LLM 问题回答检索

我们提出了一种名为 GNN-Ret 的新型检索方法，利用图神经网络（GNNs）考虑段落间的相关性来增强检索过程，并通过 RGNN-Ret 处理多跳推理问题，从而提高问题回答准确率。实验结果表明，GNN-Ret 相比多次查询的强基线方法在单次查询 LLM 的问题回答准确率上更高，而 RGNN-Ret 进一步提高了准确率，在 2WikiMQA 数据集上的准确率提高了 10.4%。

Jun, 2024

用于精确和低复杂度 SAR ATR 的图神经网络

本文提出了一种基于图神经网络的低计算复杂度的合成孔径雷达目标识别方法，该方法通过输入修剪和模型修剪两种策略达到了低计算复杂度和较高的分类准确性。

May, 2023

基于图的 SAR 数据半监督分类主动学习

使用基于图的学习和神经网络方法的结合体进行 SAR 数据分类，该方法可以在无需标记数据的情况下实现费用效益高的主动学习，并在需要 ATR 的应用中显示良好的推广性能。

Mar, 2022

语义规范识别及其在葡萄牙法律中的应用

介绍了 SNR 系统，这是一种基于 Portuguese Consumer Law 的特定领域（法律）文本语料库训练的自动语义信息抽取系统，使用 Portuguese Bert（BERTimbau）进行训练，并已在该特定领域语料库上取得了良好的结果（81.44％ F1-score），可用于信息检索等下游任务。

Mar, 2022

多跳知识库问答的子图检索增强模型

本研究提出了一种可训练的子图检索器（SR），它与后续的推理过程分离，可增强任何以子图为导向的 KBQA 模型，并通过弱监督的预训练以及端到端的微调，与 NSM 组合成为新的基于嵌入的 KBQA 方法的最新的最先进的表现。

Feb, 2022