- TransDocAnalyser:法律领域离线半结构手写文档分析框架
本研究提出了第一个针对法律领域的半结构化文档分析数据集,称为 FIR 数据集,并使用 Faster-RCNN 和 Vision Transformers 构建了端到端的离线处理框架,实现了印刷体和手写体文本的边界定位、标注和识别,通过针对入 - 利用标签层次结构采用辅助度量的多答案问句任务用于极端多标签文本分类
本研究提出了一种基于多答案提问任务的极端多标签分类方法和辅助分类评估指标,并将其应用于法律领域,结果表明该方法在 EURLEX 数据集上能够完成极端多标签分类。
- 法律文本分类的高效主动学习流程
本研究提出了一种在法律领域内使用主动学习与预训练语言模型的管道,其中利用了三个阶段的未标记数据,通过知识蒸馏引导模型的嵌入到一个语义上有意义的空间,并提出了一种简单而有效的策略找到初始的标记样本,实验表明相比传统方法在数据标注成本上更为高效 - 使用预训练变形器处理长法律文件:修改 LegalBERT 和 Longformer
本研究探讨了两个方向来处理长篇的法律文本:一是修改从 LegalBERT 启动的 Longformer 以处理更长的文本,二是修改 LegalBERT 以使用 TF-IDF 表示。结果发现,第一个方法表现最佳,在 LexGLUE 中胜过 L - 面向 DL-Ontology 的基于论证的法律推理方法
本研究探讨了如何在法律智能领域中,使用结构化论证框架和 DL 本体论实现推理,并提供了对推理结果解释的正式定义。同时,以自动驾驶汽车设计为例,证明了该理论可以处理基于不一致本体的推理问题。
- 应用于法律领域的人工智能技术现状
该研究概述了人工智能在法律领域应用的起源和发展历程,并介绍了自然语言处理在法律文本分析中的最新进展及其现状。
- 非常规任务:参与式设计在法律 AI 中的应用
本文回顾了 2006 年至 2011 年期间由 TeXT 数据库检索会议主持的 Legal Track 内发生的几个值得研究的 AI 设计和评估活动,并从文档检索领域中的律师文档审查自动化设计方法中总结了一种交互式仿真方法,该方法帮助计算机 - 调节还是不调节?零样本模型用于法律案例蕴含
本研究通过参与 COLIEE 2021 的法律案例蕴含任务,考察了预训练语言模型在法律领域的迁移能力。实验结果表明,在有限标记数据的情况下,与适应目标任务的 Fine-tuning 模型相比,没有或只部分适应的模型对数据分布的更改更加稳健。
- ACL一切皆有因:在法律文本分析中利用因果推断
本论文提出了一种新颖的基于图的因果推理(GCI)框架,可以从事实描述中构建因果图,以帮助法律从业人员做出适当的决策,并且该框架中的因果知识可以有效地注入强大的神经网络以获得更好的性能和可解释性。
- CUAD: 一个专家注释的法律合同审查自然语言处理数据集
利用 Contract Understanding Atticus 数据集,研究团队尝试解决法律领域深度学习中的困境,发现 Transformer 模型存在潜在的问题,并将其作为专业 NLP 研究领域的挑战性基准。
- EMNLPLEGAL-BERT:法学院里的大毛怪
本文研究了 BERT 在法律领域中的适应性指南并提出使用原始 BERT、在领域特定语料库上进行追加预训练的 BERT 和在领域特定语料库上从头开始预训练的 BERT 三种策略。并针对下游任务进行更广泛的超参数搜索空间,并发布了 LEGAL- - 法庭表现:自动化处理和可视化法国上诉法院判决
本文介绍了利用人工智能技术,从司法判决中提取法律指标,通过构建律师和判决的网络图和排名律师的指标来缩小信息不对称和提高公正性,同时还探讨了基于社区特征来表示案件困难程度的度量方式。
- 税法蕴涵推理与问答的法规推理数据集
研究表明,直接应用机器阅读模型在条例推理过程中的性能不佳,需要通过解决法律领域的挑战来发展在自然语言处理上的模型。
- AAAIJEC-QA:一个法律领域的问答数据集
我们制作了 JEC-QA,这是中国国家司法考试中收集的最大的法律领域问答数据集,它要求逻辑推理能力用以解答问题。我们已经发布了该数据集和我们的基线模型,以帮助提高机器理解模型的推理能力。
- ACL极端多标签法律文本分类:欧盟立法案例研究
本文讨论在法律领域中进行的极端多标签文本分类(XMTC)任务,并发布了一个新的数据集,其中包含 57k 份来自欧洲公共文档数据库 EURLEX 的立法文件,注释了来自多学科词库 EUROVOC 的概念。本文实验了几种神经分类器,表明采用 s - 使用文档向量嵌入和深度学习进行法律文件检索
本研究使用三种模型,分别基于向量空间表示法,将法律案例文档表示为不同的向量空间,并结合语义词度量和自然语言处理技术,展示了在信息检索过程中引入领域特定语义相似性测量的必要性,表明整合多种技术可显著提高信息检索的准确性,同时还展示了词相似度测