医疗保健中的合成数据
深度生成模型扩大了创建逼真合成健康数据集的潜力,但是仍然存在许多问题和挑战,包括如何评估合成数据集与原始真实数据集的相似性和预测效果,以及分享时的隐私风险。本文概述了合成健康数据领域的现状,包括生成和评估方法与工具,实际应用示例,监管和伦理环境,数据访问和治理选项,以及未来发展机会。
Jan, 2024
通过系统回顾方法,本文介绍了在医学领域中生成和评估综合性纵向患者数据的 17 种方法,涵盖了从传统模拟技术到现代深度学习方法的范围,并讨论了开发综合性纵向数据生成方法的实际指南和关键考虑因素。
Sep, 2023
本文探讨使用生成式 AI 模型,如 GAN 和 VAE,为研究和培训创建逼真的匿名患者数据,以及在医疗保健中应用合成数据的益处、挑战和未来研究方向。
May, 2023
本研究使用最先进的合成数据生成方法并对在营养学领域的特定用例中生成的数据进行深入的质量分析,展示了对合成数据进行仔细分析的必要性,并通过扩展方法,全面分析从训练模型中抽样的效果,从而在所选择的用例中基本复现了重要的真实世界分析结果。
May, 2023
该论文探讨了使用合成数据作为医学创新的一种替代方法来保护患者隐私的可行性,提出了一个新的框架来量化合成数据的统计保真度和隐私保护性能,并利用 Syntegra 技术生成的合成数据来证明这些指标。
Jan, 2021
本研究展示了合成数据的各种发展和应用方向,其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性,同时概括了如何改进和生产合成数据的替代方法。其次,介绍了合成数据转化后的真实应用存在的问题,最后,着重强调了未来在合成数据研究方面的最有潜力的方向。
Sep, 2019
本文介绍了数据中心化思维的重要性和隐私问题、提出了基于合成数据的解决方案,并开发了一种全面的测试方法(DAISYnt),以检验这种方法在高度监管的领域中的可行性和质量,例如金融和医疗保健。
Apr, 2022
在快速发展的人工智能领域中,合成数据集的创建和利用日益重要。此报告重点探讨了合成数据的多方面特点,尤其强调了这些数据集可能存在的挑战和潜在偏见。它探讨了合成数据生成的方法,涉及传统统计模型到先进深度学习技术,并研究了它们在不同领域的应用。此报告还批判性地讨论合成数据集涉及的道德考虑和法律影响,突出了确保公平性、减轻偏见和维护人工智能发展中的道德标准的机制的紧迫性。
Jan, 2024