使用神经网络进行命名实体识别的迁移学习
本文介绍了一种将神经架构应用于低资源环境的方法,针对临床笔记中的命名实体识别任务,提出了一种参数共享的迁移学习框架,并运用动态迁移网络 DTN 消除了优化过程中所需的大量计算。
Dec, 2018
本研究在仅有 10 个注释示例的情况下,通过使用预训练权重、超参数调整、预处理数据、自定义词嵌入和优化词外词汇等 5 个因素改善了命名实体识别任务,并将其 F1 得分从 69.3% 提高到 78.87%。
Nov, 2018
本论文研究使用(基于度量学习的)原型网络来进行少样本命名实体识别任务,其可以学习单词的中间表示并对其进行聚类来进行类别分类,通过将该技术与迁移学习结合使用,可以在只有很少的训练实例的情况下实现良好的分类器,进而实现零样本学习。
Dec, 2018
本文综述了深度神经网络在命名实体识别方面的应用,相对于传统的基于特征工程和监督或半监督学习算法的实体识别方法,神经网络在该领域中取得了更好的效果,并表明吸收过去的基于特征的 NER 系统的一些经验教训可以进一步提高性能。
Oct, 2019
本文描述了微软在交叉语种命名实体识别中的新实践方法,使用源语种的标注数据和目标语种的无标注数据,采用半监督学习和强化学习的方法来提取弱监督信号并实现了新的最先进性能优于现有的模型。
Jun, 2021
该研究评估了跨语言转移模型在丹麦语命名实体识别中的表现,并研究了在极少量标注数据情况下的补充效果,以及阐述了丹麦语 NER 的性能。
Mar, 2020
本文研究了从电子医疗记录中识别命名实体的问题,提出了一种基于标签感知的双重迁移学习框架 (La-DTL), 具有很强的跨科医疗命名实体识别的能力,实验证明该方法相比于强基线模型的表现有明显的提高,同时也展示了不局限于医学领域的命名实体识别应用前景。
Apr, 2018
本文提出了一种命名实体识别的方法,通过在相关领域具有相似(但并非完全相同)的命名实体类型的训练数据和少量领域内训练数据的情况下,使用迁移学习来学习领域特定的命名实体模型,这种方法假设不仅领域不匹配,而且标签不匹配。
Oct, 2016
本文介绍了一种名为 CNN-CNN-LSTM 的轻量级深度学习模型,通过增量主动学习技术,可以显著减少已标记训练样本量,达到几乎与最先进模型相媲美的性能表现。
Jul, 2017