通过图神经网络增强法规条款检索的搜索能力
介绍了比利时法规文章检索数据集(BSARD),同时在该数据集上评测了几种最先进的检索算法,发现精调密集检索模型显著优于其他系统,最终在该数据集任务中取得了 74.8% R@100 的良好成绩。
Aug, 2021
为了填补现有法律查询数据集对非专业用户提出的实际查询的不足,本文引入了 STAtute Retrieval Dataset(STARD),该数据集由 1543 个来自现实世界法律咨询的查询案例和 55348 个候选法规文章组成,并通过对各种检索基线模型进行综合评估,揭示了现有检索方法在非专业用户提交的实际查询中的不足,为进一步探索和研究提供了必要性。
Jun, 2024
本文探索了最强大的 GPT-3 模型 ——text-davinci-003,在一个已建立的立法推理数据集 SARA 上的能力,并尝试了各种方法,包括动态少量提示、思维链提示和零提示。尽管我们在 GPT-3 中取得了优于以前发表的最佳结果的成果,但我们也发现了它的一些明显错误。通过研究为什么会出现这些错误,我们发现 GPT-3 对 SARA 基于的实际美国法规的先前知识有所欠缺。更重要的是,GPT-3 在回答有关简单的合成法规的直接问题时表现不佳。当将合成法规用句子形式书写时,提出相同的问题,我们发现 GPT-3 的一些差的表现是由难以解析通常包含子节和段落结构的法规的典型结构造成的。
Feb, 2023
本研究提出了一种名为 LeSICiN 的模型,将法律引文网络和文本内容结合起来,成功地实现了对印度刑事法典(IPC)案例中存在的法律法规进行识别。通过对包含多个印度法院案件的案例事实和 IPC 法规的数据集进行实验,证实了该模型在法律条款识别任务上表现优越。
Dec, 2021
我们提出了一种名为 GNN-Ret 的新型检索方法,利用图神经网络(GNNs)考虑段落间的相关性来增强检索过程,并通过 RGNN-Ret 处理多跳推理问题,从而提高问题回答准确率。实验结果表明,GNN-Ret 相比多次查询的强基线方法在单次查询 LLM 的问题回答准确率上更高,而 RGNN-Ret 进一步提高了准确率,在 2WikiMQA 数据集上的准确率提高了 10.4%。
Jun, 2024
本文提出了一种基于图神经网络的低计算复杂度的合成孔径雷达目标识别方法,该方法通过输入修剪和模型修剪两种策略达到了低计算复杂度和较高的分类准确性。
May, 2023
使用基于图的学习和神经网络方法的结合体进行 SAR 数据分类,该方法可以在无需标记数据的情况下实现费用效益高的主动学习,并在需要 ATR 的应用中显示良好的推广性能。
Mar, 2022
介绍了 SNR 系统,这是一种基于 Portuguese Consumer Law 的特定领域(法律)文本语料库训练的自动语义信息抽取系统,使用 Portuguese Bert(BERTimbau)进行训练,并已在该特定领域语料库上取得了良好的结果(81.44% F1-score),可用于信息检索等下游任务。
Mar, 2022
本研究提出了一种可训练的子图检索器(SR),它与后续的推理过程分离,可增强任何以子图为导向的 KBQA 模型,并通过弱监督的预训练以及端到端的微调,与 NSM 组合成为新的基于嵌入的 KBQA 方法的最新的最先进的表现。
Feb, 2022