印度法院裁决的命名实体识别

EMNLPNov, 2022

Named Entity Recognition in Indian court judgments

Prathamesh Kalamkar, Astha Agarwal, Aman Tiwari, Smita Gupta, Saurabh Karn...

TL;DR本文介绍了一个包含 14 种法律实体类型的 46545 个已注释的法律命名实体语料库，同时构建了一个提取法律命名实体的基准模型。

Abstract

Identification of named entities from legal texts is an essential building block for developing other legal artificial intelligence applic

legal texts named entities artificial intelligence corpus baseline model

发现论文，激发创造

E-NER -- 一份法律文本的命名实体识别注释语料库

本研究主要介绍了一个公共的法律命名实体识别数据集 E-NER，它表明将通用英语文本数据集训练的命名实体识别模型应用于法律文本会导致重大的性能下降，与在 E-NER 数据集上训练和测试相比，F1 分数下降了 29.4％至 60.4％。

Dec, 2022

FlairNLP 在 SemEval-2023 任务 6b 中的应用：利用上下文字符串嵌入从法律文本中提取法律命名实体

本文介绍了利用命名实体提取技术和双向 LSTM 模型结合 Flair 嵌入对印度法院文本进行标注的实验，并公开了 BIO 格式的数据集。

Jun, 2023

用于命名实体识别的德语法律文件数据集

该论文介绍了一份为德国联邦法院判决中开发的命名实体识别数据集，包含约 67,000 个句子和超过 2,000,000 个标记，共标注了 54,000 个实体，涵盖了 19 个细粒度的语义类别，同时还有超过 35,000 个基于 TimeML 的时间表达式的辅助标注。该数据集可用于训练用于德国法律文件的 NER 服务，已在 EU 项目 Lynx 中发布，并遵循 CC-BY 4.0 许可协议。

Mar, 2020

近期命名实体识别研究进展综述

命名实体识别（NER）旨在从文本中提取命名真实世界对象并确定它们的类型，本文首先概述了最近流行的方法，然后探讨了其他调查中较少涉及的基于图和变换器的方法，包括大型语言模型（LLMs）。其次，重点介绍了适用于稀缺注释数据集的方法。第三，我们评估了主要 NER 实现在不同类型的数据集上的性能，并对从未共同考虑过的算法进行了深入比较。我们的实验揭示了数据集特征如何影响我们比较的方法的行为。

Jan, 2024

跨文化姓名识别

该研究旨在改进个人姓名的识别，在识别不同文化背景下的姓名方面，通过实验比较结合字符和词的输入模型与传统的 NER 模型，发现该模型表现更好且可能提高准确率。

Jan, 2024

司法案例的自动知识图谱构建

探索认知智能在法律知识中的应用，聚焦于司法人工智能的发展。利用自然语言处理作为核心技术，自动构建司法案例知识图谱的方法，包括实体识别、关系抽取等多项任务，以及在一个交通事故责任纠纷案例研究中的显著优势。

Apr, 2024

命名实体识别的深度学习调查

本文基于三个维度的分类法，系统地回顾了深度学习在命名实体识别上的应用技术，并介绍了面临的挑战和未来的研究方向。

Dec, 2018

维基百科实体排名

本研究利用分类、链接结构以及实体示例等方法，基于 Wikipedia 文献集合，提出了一种较为有效的实体排名系统，并发现该系统可以显著提高检索效果。

Nov, 2007

NERetrieve: 下一代命名实体识别与检索数据集

通过大规模语言模型，命名实体识别可以达到更精细化的实体类型识别、零样本识别和语句检索等目标，但这些目标仍然需要进一步研究和探索。

Oct, 2023

一个用于命名实体识别的芬兰新闻语料库

本文提供一份芬兰新闻文章语料库，其中包含 953 篇来自 Digitoday 技术新闻平台的文章（共 193742 个单词标记），其中涵盖六种命名实体类别；并对该语料库在两个测试集中使用基于规则与两种深度学习系统进行了基础实验。

Aug, 2019