Apr, 2021

BERT在临床笔记上的预训练是否会透露敏感数据?

TL;DR本文描述了一系列旨在从已训练的BERT模型中恢复个人健康信息(PHI)的方法,同时提供了实验设置和基准探测模型,以促进类似研究。结果显示简单的探测方法无法有效地从MIMIC-III EHR训练的BERT中提取敏感信息,但更复杂的“攻击”可能会成功。因此,释放训练过的类似EHR的BERT模型是否存在数据隐私问题,需要更加深入的研究。