医疗保健中的合成数据

Apr, 2023

Synthetic Data in Healthcare

Daniel McDuff, Theodore Curran, Achuta Kadambi

TL;DR本文旨在介绍模拟器生成数据在医疗保健领域的应用与潜在优势，同时指出了其存在的潜在风险和问题。

Abstract

synthetic data are becoming a critical tool for building artificially intelligent systems. simulators provide a way of generating data systematically and at scale. These data can then be used either exclusively,

synthetic data simulators artificial intelligence healthcare bias

发现论文，激发创造

合成健康数据概述

深度生成模型扩大了创建逼真合成健康数据集的潜力，但是仍然存在许多问题和挑战，包括如何评估合成数据集与原始真实数据集的相似性和预测效果，以及分享时的隐私风险。本文概述了合成健康数据领域的现状，包括生成和评估方法与工具，实际应用示例，监管和伦理环境，数据访问和治理选项，以及未来发展机会。

Jan, 2024

生成和评估合成纵向患者数据的方法：系统综述

通过系统回顾方法，本文介绍了在医学领域中生成和评估综合性纵向患者数据的 17 种方法，涵盖了从传统模拟技术到现代深度学习方法的范围，并讨论了开发综合性纵向数据生成方法的实际指南和关键考虑因素。

Sep, 2023

金融中的合成数据应用

合成数据在金融领域取得了巨大的进展，可以应用于各种数据模式，解决隐私、公平性和可解释性等问题。

Dec, 2023

在医疗领域利用生成式人工智能模型进行合成数据生成：平衡研究和隐私

本文探讨使用生成式 AI 模型，如 GAN 和 VAE，为研究和培训创建逼真的匿名患者数据，以及在医疗保健中应用合成数据的益处、挑战和未来研究方向。

May, 2023

为纵向队列研究生成合成数据 —— 评估、方法扩展与已发布的数据分析结果再现

本研究使用最先进的合成数据生成方法并对在营养学领域的特定用例中生成的数据进行深入的质量分析，展示了对合成数据进行仔细分析的必要性，并通过扩展方法，全面分析从训练模型中抽样的效果，从而在所选择的用例中基本复现了重要的真实世界分析结果。

May, 2023

使用合成数据训练 AI 模型：可持续发展的机遇与风险

研究了合成数据的政策，包括创建、利用和传播。必须在保护隐私和数据的可用性之间找到平衡，并制定标准化准则来应对合成数据的挑战。

Aug, 2023

合成医疗数据的真实性和隐私

该论文探讨了使用合成数据作为医学创新的一种替代方法来保护患者隐私的可行性，提出了一个新的框架来量化合成数据的统计保真度和隐私保护性能，并利用 Syntegra 技术生成的合成数据来证明这些指标。

Jan, 2021

深度学习的合成数据

本研究展示了合成数据的各种发展和应用方向，其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性，同时概括了如何改进和生产合成数据的替代方法。其次，介绍了合成数据转化后的真实应用存在的问题，最后，着重强调了未来在合成数据研究方面的最有潜力的方向。

Sep, 2019

在受监管行业中实现合成数据采纳

本文介绍了数据中心化思维的重要性和隐私问题、提出了基于合成数据的解决方案，并开发了一种全面的测试方法（DAISYnt），以检验这种方法在高度监管的领域中的可行性和质量，例如金融和医疗保健。

Apr, 2022

人工智能中的合成数据：挑战、应用和伦理影响

在快速发展的人工智能领域中，合成数据集的创建和利用日益重要。此报告重点探讨了合成数据的多方面特点，尤其强调了这些数据集可能存在的挑战和潜在偏见。它探讨了合成数据生成的方法，涉及传统统计模型到先进深度学习技术，并研究了它们在不同领域的应用。此报告还批判性地讨论合成数据集涉及的道德考虑和法律影响，突出了确保公平性、减轻偏见和维护人工智能发展中的道德标准的机制的紧迫性。

Jan, 2024