去往何处即是你的身份 —— 基于机器学习的语义隐私攻击研究

Oct, 2023

去往何处即是你的身份 —— 基于机器学习的语义隐私攻击研究

Where you go is who you are -- A study on machine learning based semantic privacy attacks

Nina Wiedemann, Ourania Kounadi, Martin Raubal, Krzysztof Janowicz

TL;DR机器学习和位置数据的隐私攻击对隐私造成了显著风险，并且需要隐私监管来保护个人的位置信息。

Abstract

Concerns about data privacy are omnipresent, given the increasing usage of digital applications and their underlying business model that includes selling user data. location data is particularly sensitive since t

data privacy location data machine learning privacy attacks privacy regulations

发现论文，激发创造

你去了哪里？地点推荐隐私风险研究

为了更好地理解和量化基于移动数据的机器学习模型的隐私泄露情况，我们设计了一个隐私攻击套件，其中包含数据提取和成员推断攻击，针对最广泛使用的基于兴趣点推荐模型之一进行定制。我们的实证评估使用了两个真实世界的移动数据集，证明了当前的兴趣点推荐模型容易受到我们的攻击。我们还提供了独特的发现，以了解哪种类型的移动数据更容易受到隐私攻击。最后，我们评估了对抗这些攻击的防御方法，并强调了未来的方向和挑战。

Oct, 2023

注意：大型多模态模型正在关注你的地理隐私

该研究探讨了地理隐私在增加的在线数据共享和信息收集技术进展的背景下被低估的问题，并重点关注了这些发展对个人隐私的影响。研究通过开发名为 “Dr. Watson” 的基于 GPT-4 的高级 AI 工具，从公开数据源中分析和提取地理信息，展示了这些技术的潜在风险，并揭示了当前地理隐私措施的漏洞。结论强调了在高级 AI 和广泛社交媒体使用时，加强对地理隐私泄露的意识和保护措施的紧迫性。

Nov, 2023

聆听谁在敲门？对聚合位置数据的成员推断攻击

本研究挖掘了对聚合位置时间序列的成员推断攻击可能存在的隐私威胁，并探究了此类攻击的机理，效果和防御方法。研究发现，差分隐私机制可以降低此类攻击的威胁，但同时也导致了显著的效用损失。此外，攻击者的先验信息和数据聚合的规模和时间范围等因素也会影响此类攻击的成功率。最终，本文提出了适用于真实环境的聚合位置数据成员推断攻击的评估框架，可供数据发布者进行隐私保护质量评估，也可供监管机构进行数据隐私监督。

Aug, 2017

基于 Android 移动设备互联网流量的位置数据泄露分析

研究了 Android 应用程序通过互联网网络流量以明文形式泄露位置数据的现象，提出了从原始网络流量中挖掘和过滤位置数据并利用地理位置聚类方法推断用户兴趣点的过程，证实了此现象在智能手机用户中的普遍性和严重性，85% 的用户设备泄露了位置数据，而通过这些数据推断用户兴趣点的暴露率约为 61%。

Dec, 2018

基于位置的系统的差分隐私：地理不可区分性

本文介绍了基于位置系统中用户隐私问题，提出了一种新的保障用户位置隐私的定义，并通过在用户位置中添加控制随机噪声的扰动技术来实现此目的，并与其他文献中的保护机制进行比较，结果表明我们的机制在不依赖于先验知识的情况下，为用户提供了最好的隐私保障。

Dec, 2012

机器学习中隐私攻击调查

对机器学习中隐私攻击的分类及防御方法进行了研究和探讨。

Jul, 2020

聚合位置数据的零辅助知识成员推理攻击

在从群体中频繁收集和共享位置数据以指导政策和决策的过程中，存在成员推断攻击的隐私问题。本文提出了一种在汇总位置数据上进行零辅助知识攻击的方法，通过生成合适的合成轨迹，从而消除了对真实个体轨迹的辅助数据集的需求，并对偏差和噪音进行了校正。研究表明，这种方法在保护隐私机制应用之前仍然适用，且即使攻击者仅了解目标的一小部分位置历史也具有很高的有效性，因此强调了对差分隐私的强保护需求。

Jun, 2024

保护照片集合的地理位置隐私

研究了图片分享对位置隐私的潜在威胁，采用优化算法和深度学习方法，通过精选照片和线性规划等技术实现了位置隐私的保护。

Dec, 2019

基于智能手机嵌入式传感器数据的用户社交环境和熟悉场所的设备端建模

该论文提出了一种基于移动设备的无监督轻量级方法来直接模拟用户的社交上下文和位置，该方法利用了自我网络模型，对智能手机嵌入式传感器数据提取高级别的语义上下文特征，在社交上下文方面，该方法利用了在用户和设备之间的物理和网络社交互动的数据，对于位置，它优先建模了特定位置的熟悉度程度，相对于只使用与物理上下文相关的特征，该方法在 AUROC、Precision 和 Recall 方面的表现都有所提高。

Jun, 2023

机器学习模型隐私风险的系统评估

本文研究了机器学习模型的隐私风险和成员推理攻击，提出了一种基于预测熵修改的推理攻击和一个新的隐私风险得分指标，同时对已有的防御机制进行了基准攻击，实验结果表明个体样本的隐私风险得分分布差异很大，同时确定源风险的主要因素与模型敏感性、综合误差和特征嵌入有关系。

Mar, 2020