Jan, 2024
合成健康数据概述
A primer on synthetic health data
Jennifer Anne Bartell, Sander Boisen Valentin, Anders Krogh, Henning Langberg, Martin Bøgsted
TL;DR深度生成模型扩大了创建逼真合成健康数据集的潜力,但是仍然存在许多问题和挑战,包括如何评估合成数据集与原始真实数据集的相似性和预测效果,以及分享时的隐私风险。本文概述了合成健康数据领域的现状,包括生成和评估方法与工具,实际应用示例,监管和伦理环境,数据访问和治理选项,以及未来发展机会。