BriefGPT.xyz
Oct, 2020
PHICON:通过数据增强提高临床文本去识别模型的泛化能力
PHICON: Improving Generalization of Clinical Text De-identification Models via Data Augmentation
HTML
PDF
Xiang Yue, Shuang Zhou
TL;DR
本研究提出使用PHICON数据增强方法,即采用命名实体替换和上下文增强模拟保护健康信息从而提高神经模型的鲁棒性和泛化能力,实验证明此方法可显著提高新数据集的F1得分。
Abstract
de-identification
is the task of identifying
protected health information
(PHI) in the clinical text. Existing neural
de-identification
mo
→