TAPAS：用于合成数据的对抗隐私审计工具箱

Nov, 2022

TAPAS：用于合成数据的对抗隐私审计工具箱

TAPAS: a Toolbox for Adversarial Privacy Auditing of Synthetic Data

Florimond Houssiau, James Jordon, Samuel N. Cohen, Owen Daniel, Andrew Elliott...

TL;DR介绍了一个名为 TAPAS 的攻击工具箱，用于评估广泛场景下的合成数据隐私，并展示了几个例子来说明针对合成数据的隐私威胁。

Abstract

personal data collected at scale promises to improve decision-making and accelerate innovation. However, sharing and using such data raises serious privacy concerns. A promising solution is to produce

personal data privacy concerns synthetic data tapas privacy threats

发现论文，激发创造

隐私保护的可扩展性：学习分析中全面综合的合成表格数据生成与评估

我们提出了一种综合评估合成数据的方法，该方法包括合成数据质量的三个维度：相似性、实用性和隐私性。通过将这种评估应用于三个不同的学习分析数据集以及三种不同的合成数据生成方法，我们的结果表明合成数据可以在保护隐私的同时保持与真实数据相似的实用性。此外，针对不同学习分析场景中不同的隐私和数据实用性需求，我们提出了定制的合成数据生成建议。该论文不仅提供了合成数据的综合评估，还说明了在学习分析领域中缓解隐私问题的潜力，从而促进了合成数据在学习分析中的更广泛应用，推动了开放科学的良好实践。

Jan, 2024

基于隐私友好合成数据的面部展示攻击检测 ——SynthASpoof

本文介绍了一种基于合成数据的面部防伪数据集，名为 SynthASpoof，简要阐述了 MixStyle 的工作原理以及使用合成数据作为有限认证训练数据的补充，并给出了该数据集、实现和预训练权重的公开链接。

Mar, 2023

合成数据 -- 匿名化之地普通日

评估了现有生成模型绘制的合成数据的隐私保护优势，发现与传统的匿名化技术相比，其提供的隐私保护水平无法预测且数据效用低下，并不存在更好的隐私保护与数据效用均衡的解决方案。

Nov, 2020

合成数据不需要其他辅助数据：针对合成数据的成员推断攻击无需其他假设的去除

本研究表明，假设攻击者只能访问合成数据而不是其他辅助数据集，会导致轻松攻击合成数据，因此需要检验合成数据隐私保护的安全性。

Jul, 2023

ReasTAP: 通过合成推理实例在预训练期间注入表格推理技能

本文介绍了一种基于强化预训练的模型 ReasTAP，可以注入高级的表格推理能力，在多项任务上取得新的最先进性能和显著的改进。

Oct, 2022

基于分区的差分隐私合成数据生成

我们的方法采用基于分区的方法来改善合成数据的质量和可用性，在限定的隐私预算下，我们的方法优于现有方法，因此是私人合成数据共享的首选。

Oct, 2023

TAPAS: 加速（加密）预测服务的技巧

探讨了机器学习在预测问题上的广泛应用，提出了一种使用完全同态加密进行预测的新框架，解决了数据隐私和计算量的问题。

Jun, 2018

通过预训练实现弱监督的表格解析

TAPAS 是一种用于表格上回答自然语言问题的模型，它使用弱监督训练，不需要生成逻辑式，而是通过对表格中的单元格进行选择并可选择性地应用相应的聚合算子来预测表格的结果，并在三个语义分析数据集上取得了优异成绩。

Apr, 2020

TAPS 责任矩阵：一种用于负责任的数据科学设计的工具

本研究提出了一个名为 TAPS-RM 的框架，该框架可以通过社会、法律和伦理的视角探索数据科学项目的方方面面，并明确参与者的责任。TAPS-RM 是推动负责任的数据科学的设计的工具。

Feb, 2023

表格合成数据中的隐私测量：现状与未来研究方向

综合数据是一种隐私增强技术，但缺乏隐私保护程度的标准。本文讨论了提出的量化方法，有助于制定综合数据隐私标准、促进多学科讨论，并帮助综合数据研究人员做出有根据的建模和评估决策。

Nov, 2023