Mar, 2023
临床数据仓库中自然语言处理算法的开发和验证,用于匿名化文件
Development and validation of a natural language processing algorithm to pseudonymize documents in the context of a clinical data warehouse
Xavier Tannier, Perceval Wajsbürt, Alice Calliger, Basile Dura, Alexandre Mouchet...
TL;DR本研究的目标是解决临床报告去识别化的问题,以允许访问数据以进行研究,同时确保患者隐私。作者通过使用深度学习模型和手动规则,对临床文件进行伪匿名化,取得了 0.99 的 F1 评分,并分享了相关代码和指南。