本研究主要介绍了一个公共的法律命名实体识别数据集 E-NER,它表明将通用英语文本数据集训练的命名实体识别模型应用于法律文本会导致重大的性能下降,与在 E-NER 数据集上训练和测试相比,F1 分数下降了 29.4%至 60.4%。
Dec, 2022
本文介绍了利用命名实体提取技术和双向 LSTM 模型结合 Flair 嵌入对印度法院文本进行标注的实验,并公开了 BIO 格式的数据集。
Jun, 2023
该论文介绍了一份为德国联邦法院判决中开发的命名实体识别数据集,包含约 67,000 个句子和超过 2,000,000 个标记,共标注了 54,000 个实体,涵盖了 19 个细粒度的语义类别,同时还有超过 35,000 个基于 TimeML 的时间表达式的辅助标注。该数据集可用于训练用于德国法律文件的 NER 服务,已在 EU 项目 Lynx 中发布,并遵循 CC-BY 4.0 许可协议。
Mar, 2020
命名实体识别(NER)旨在从文本中提取命名真实世界对象并确定它们的类型,本文首先概述了最近流行的方法,然后探讨了其他调查中较少涉及的基于图和变换器的方法,包括大型语言模型(LLMs)。其次,重点介绍了适用于稀缺注释数据集的方法。第三,我们评估了主要 NER 实现在不同类型的数据集上的性能,并对从未共同考虑过的算法进行了深入比较。我们的实验揭示了数据集特征如何影响我们比较的方法的行为。
Jan, 2024
该研究旨在改进个人姓名的识别,在识别不同文化背景下的姓名方面,通过实验比较结合字符和词的输入模型与传统的 NER 模型,发现该模型表现更好且可能提高准确率。
探索认知智能在法律知识中的应用,聚焦于司法人工智能的发展。利用自然语言处理作为核心技术,自动构建司法案例知识图谱的方法,包括实体识别、关系抽取等多项任务,以及在一个交通事故责任纠纷案例研究中的显著优势。
Apr, 2024
本文基于三个维度的分类法,系统地回顾了深度学习在命名实体识别上的应用技术,并介绍了面临的挑战和未来的研究方向。
Dec, 2018
本研究利用分类、链接结构以及实体示例等方法,基于 Wikipedia 文献集合,提出了一种较为有效的实体排名系统,并发现该系统可以显著提高检索效果。
Nov, 2007
通过大规模语言模型,命名实体识别可以达到更精细化的实体类型识别、零样本识别和语句检索等目标,但这些目标仍然需要进一步研究和探索。
Oct, 2023
本文提供一份芬兰新闻文章语料库,其中包含 953 篇来自 Digitoday 技术新闻平台的文章(共 193742 个单词标记),其中涵盖六种命名实体类别;并对该语料库在两个测试集中使用基于规则与两种深度学习系统进行了基础实验。
Aug, 2019