Apr, 2023
通过分层自回归语言模型合成极高维长期电子医疗记录
Synthesize Extremely High-dimensional Longitudinal Electronic Health Records via Hierarchical Autoregressive Language Model
Brandon Theodorou, Cao Xiao, Jimeng Sun
TL;DR通过提出一种分层自回归语言模型(HALO),我们可以生成长期的高维电子病历,这些病历既保留了真实病历的统计特性,又不会泄露隐私;同时可以用于训练准确的机器学习模型,而无需进行可变量的选择或聚合,从而提高 ML 模型的准确性,并能通过将真实和人造数据进行结合来增强 ML 模型的准确性。