使用汉字对命名实体进行识别
本文提出了一种简单而有效的基于神经网络的框架 ME-CNER,用于通过多粒度的字符级表示来识别汉语微博中的命名实体。实验结果表明,该方法在 Weibo 数据集上取得了显著的性能提升。
Aug, 2019
该研究提出了一种名为 “融合字形网络” 的方法,通过添加汉字字符中的字形信息和交互信息,结合 CGS-CNN 和 LSTM-CRF 技术实现了中文命名实体识别的新突破。
Jan, 2020
本文提出了一种神经方法来解决中文命名实体识别的挑战,该方法包括使用 CNN-LSTM-CRF 神经架构来捕捉 CNER 的本地和长距离上下文,引入统一框架来联合训练 CNER 和分词模型以增强 CNER 模型在识别实体边界方面的能力,以及使用自动方法从现有标记数据生成伪标记样本来扩充训练数据。实验结果表明,该方法特别适用于训练数据不足的情况下,可以有效提高中文命名实体识别的性能。
Apr, 2019
本文通过重新检验增强命名实体识别的常见做法和详细分析模型性能和词表特征之间的关系,指导我们构建更合适的词表。发现:(1)词表有助于解决传统 NER 模型难以学习的情况。(2)模型性能极大地受益于高质量的预训练词汇嵌入。(3)一个好的词表应该涵盖更多在训练集和测试集中都能匹配到的实体。
Jul, 2022
本研究探讨了一种名为 Convolutional Attention Network (CAN) 的中文命名实体识别方法,该方法基于字符级卷积神经网络与门控循环神经网络,通过局部注意层和全局自注意层来捕获相邻字符和句子上下文的信息,并不依赖于外部词典等资源,使用小的字符嵌入,有效地提高了识别性能。该方法在微博、MSRA 和中文简历数据集等不同领域数据集上表现优于现有最先进方法,且不需要使用字嵌入和外部词典资源。
Apr, 2019
本文研究利用神经网络模型共同训练中文社交媒体的命名实体识别(NER)和分词(word segmentation)任务,与之前的研究相比,使用 LSTM-CRF 模型得到了将近 5% 的显著提高。
Mar, 2016
本研究旨在提出一种基于外部知识语义增强的神经网络方法,通过多通道语义融合模型结合检索自搜索引擎的外部相关文本,对中文命名实体识别进行研究,实验证明该方法在正式和社交媒体语境下四个命名实体数据集中均取得了较好的效果。
Oct, 2022
本文介绍一种使用神经网络方法进行实体识别的系统,主要聚焦于研究如何在建模时引入词汇特征,并通过低维向量空间嵌入和高效训练得到最佳结果,最终在公开数据集上取得了较高的 F1 分数。
Jun, 2018
本研究提出一种可将词汇词典简单地并入字表示的方法,以提高中国命名实体识别的性能,且速度比现有最先进的方法快 6.15 倍,同时具有更好的性能与可与预训练模型集成的能力。
Aug, 2019
本文介绍了一种基于 CharWNN 深度神经网络的自适应特征命名实体识别系统,使用自动学习特征实现多语种 NER 任务,证明了字符嵌入在 NER 中的有效性。试验结果表明,CharWNN 的性能优于现有最先进的系统。
May, 2015