Jan, 2020

利用序列模型预测字符的大小写的高效架构

TL;DR本文提出一种使用卷积神经网络 (CNN)、双向长短期记忆网络 (LSTM) 和条件随机场 (CRF) 相结合的架构,在字符级别上对大小写进行恢复,从而提高自然语言处理中后续处理任务的准确性。与传统基于统计和深度学习的方法相比,我们提出的方法在 F1 得分上展现出 0.83 的提升,由于 Truecasing 在多种处理任务中通常用作预处理步骤,因此 F1 得分的每个增加都将带来非常显著的语言处理任务改进。