使用 Truecasing 预训练的鲁棒命名实体识别

AAAIDec, 2019

使用 Truecasing 预训练的鲁棒命名实体识别

Robust Named Entity Recognition with Truecasing Pretraining

Stephen Mayhew, Nitish Gupta, Dan Roth

TL;DR本文通过预测文本大小写的方式，提出了一种新方法改进了命名实体识别在嘈杂无序情况下的稳健性表现，该方法利用未标注数据的真实大小写器与标准的 BiLSTM-CRF 模型结合。实验表明我们的方法在无序文本中提高了性能，并在 WNUT17 共享任务数据集上实现了新的最佳效果。

Abstract

Although modern named entity recognition (NER) systems show impressive performance on standard datasets, they perform poorly when presented with noisy data. In particular, capitalization is a strong signal for entities in many languages, and even →

named entity recognition noisy data truecasing bilstm-crf state of the art models

发现论文，激发创造

不对任何单词进行大写标记的 NER 和 POS

本研究通过修改大小写来解决 NLP 任务中大写信号的问题，将大小写训练数据串联起来可以使模型在大小写文本中都拥有良好的性能，同时对嘈杂的 Twitter 数据进行测试，结果表明我们的解决方案提高了 8％的 F1 检测率。

Mar, 2019

使用准确高效的分层 RNN 模型进行语言建模的大写标准化

本研究提出了一种基于递归神经网络的两级分层的单词和字符的快速，准确和紧凑的文本真实大小写还原模型，该模型被用于在联合学习框架下的语言建模。经过归一化处理的语料库的语言模型表现与完美大小写匹配处理的语料库的模型表现相当，这对于虚拟键盘应用程序中的减少预测误差率至关重要。在用户 A/B 实验中，我们还展示了该模型能够减少语音识别中的大写字符错误率和单词错误率。

Feb, 2022

利用序列模型预测字符的大小写的高效架构

本文提出一种使用卷积神经网络 (CNN)、双向长短期记忆网络 (LSTM) 和条件随机场 (CRF) 相结合的架构，在字符级别上对大小写进行恢复，从而提高自然语言处理中后续处理任务的准确性。与传统基于统计和深度学习的方法相比，我们提出的方法在 F1 得分上展现出 0.83 的提升，由于 Truecasing 在多种处理任务中通常用作预处理步骤，因此 F1 得分的每个增加都将带来非常显著的语言处理任务改进。

Jan, 2020

高度不平衡数据下适应性命名实体识别

本报告提出了一种基于条件随机场层和双向 LSTM 层的神经网络体系结构，其中嵌入向量（Glove，BERT）的融合输入被用来增强模型的泛化能力，还引入了一个分类模型来分离句子并对弱类和强类进行优化以提高 Named Entity Recognition 任务的性能。经实验证明，该方法显著提高了弱类的表现结果，并且只使用了非常少量的数据集。

Mar, 2020

命名实体识别中对大小写错误的鲁棒性

文中通过数据增强的方法，提出了一种基于学习的 Named entity recognition 方法，可以很好地识别大小写错误，而不影响其在规范文本上的性能，并显著提高了对异体用户文本的泛化能力。

Nov, 2019

跨文化姓名识别

该研究旨在改进个人姓名的识别，在识别不同文化背景下的姓名方面，通过实验比较结合字符和词的输入模型与传统的 NER 模型，发现该模型表现更好且可能提高准确率。

Jan, 2024

医学 ASR 标点及大小写预测的稳健性

本论文提出了一种基于预训练掩码语言模型，如 BERT、BioBERT 和 RoBERTa 的条件联合建模框架，用于预测标点符号和大小写，并介绍了域和任务特定自适应技术和数据增强方法，可提高医学领域 ASR 系统输出的识别准确率。实验结果表明，所提出的模型在字典和会话样式语料库上，相对于基线模型，F1 度量下实现了～5% 的绝对改进和～10% 的 ASR 输出优化。

Jul, 2020

NER-BERT: 一个用于低资源实体标注的预训练模型

本文介绍了一种基于大规模语言模型的命名实体识别预训练方法，通过构建大型高质量命名实体语料库，最终得到的 NER-BERT 模型在九个不同领域的低资源场景下明显优于其他模型。

Dec, 2021

面向历史德语的鲁棒命名实体识别

应用预训练的基于字符的语言模型，成功提升了历史德语低资源命名实体识别准确性，并相较于经典 CRF-based 方法和 Bi-LSTMs，提高了高达 6% 的 F1 得分表现。

Jun, 2019

使用 BERT-CRF 进行葡萄牙语命名实体识别

本研究使用神经网络进行语言表示，探讨在葡语 NER 任务中使用 Portuguese BERT 和 BERT-CRF 结构的转移学习能力，采用基于特征和微调的训练策略，最终实现了比现有最优模型更好的结果。

Sep, 2019