- 联邦学习中的知识蒸馏:长期挑战和新解决方案综述
本文综述了基于知识蒸馏的联邦学习的现状、方法和挑战,并探讨了隐私保护、数据异构性、通信效率和个性化等相关问题。
- ACL可迁移性嵌入反转攻击:揭示文本嵌入的隐私风险,无需模型查询
研究了与文本嵌入相关的隐私风险,重点关注攻击者无法访问原始嵌入模型的情景。通过开发一种传递攻击方法,利用替代模型模拟受害模型的行为,使攻击者能够从文本嵌入中推断敏感信息,从而揭示了嵌入技术中潜在的隐私漏洞,强调了加强安全措施的必要性。
- 个人属性推断的合成数据集
通过构建仿真框架和生成合成评论数据集,研究人员证明其提供了一个强大且保护隐私的基础,用于理解和减轻基于推理的大型语言模型所带来的隐私威胁。
- ACL语言模型中可学习的隐私神经元定位
我们引入了一种创新的方法来定位 LLMs 中敏感个人身份信息 (PII) 的神经元,通过对抗训练使用可学习的二进制权重掩码来定位特定的神经元,以解决 LLMs 中 PII 的记忆机制的不清楚性,并通过定位的隐私神经元的失活来减轻 PII 风 - GI-SMN:无先验知识的反梯度逆转攻击对抗联邦学习
通过 Style Migration Network(GI-SMN)提出了一种新的梯度逆转攻击方法,它打破了以往梯度逆转攻击所做的强假设,在批处理中实现了高相似度的用户数据重建,同时超越了当前的梯度逆转攻击方法和差分隐私防御方法。
- 使用视觉 - 语言模型从图像中推断私密属性
通过研究多模式视觉 - 语言模型(VLMs)的影响力,我们发现这些模型能够从在线发布的图像中推理出个人属性,其中 7 个最先进模型的准确性高达 77.6%,这意味着未来的模型可能被用作更强大的对手,需要开发适当的防御机制。
- SiloFuse:使用潜在表格扩散模型进行跨储存生成合成数据
SiloFuse 是一种用于跨多个私有数据存储中进行高质量合成的新型生成框架,通过分布式潜在表扩散架构确保个体隐私,以及通过实验证明其相对于集中式扩散合成器的优越性和对特征重排和客户端数量变化的鲁棒性。
- 表格 GANs 的隐私再识别攻击
我们研究了生成对抗网络(GANs)用于创建表格合成数据集可能导致的隐私风险,发现恶意攻击者可以通过选择与训练样本最接近的合成样本对隐私构成重大威胁,并且当攻击者具有对生成模型的知识或黑盒访问时,隐私威胁显著增加,而使用多目标优化的重构攻击甚 - 六级隐私:金融合成数据的框架
合成数据在金融应用中日益重要,除了提供改进的金融建模和更好的测试程序之外,它也带来了隐私风险。本文引入了一个 “级别” 隐私层次结构,用于分类合成数据生成方法和它们提供的逐步改进的保护措施,以评估隐私保护的程度。同时,我们介绍了金融合成数据 - 透过交叉注意力揭示和减轻文本到图像扩散模型中的记忆化
研究论文概述:最近的文本到图像扩散模型在生成高质量图像方面展示了显著的能力,但是越来越多的研究表明这些模型从训练数据中记忆并复制图像,引发了对潜在版权侵权和隐私风险的巨大担忧。在这项研究中,我们通过检查交叉注意力机制与记忆现象的关系,提供了 - 振荡泄密:微调扩散模型能够放大生成的隐私风险
扩散模型存在隐私风险,其中 Shake-to-Leak (S2L) 是一种新的风险,通过操纵数据以微调预训练模型,可以增强现有的隐私风险,尤其在扩散模型下还比过去认识的更严重。
- 大型语言模型的监管:圆桌会议报告
在这篇论文中,我们详细总结了讨论会的全部过程,包括问题制定的重要贡献以及头脑风暴讨论中提出的潜在法律和监管干预措施。
- 针对 GPT 模型的对话重建攻击
近期,大型语言模型(LLMs)的领域取得了显著进展,GPT 系列模型为代表。为了优化任务执行,用户通常与云环境中的 GPT 模型进行多轮对话。本文介绍了一种特定的针对 GPT 模型的对话重建攻击,评估了其中存在的隐私风险,并引入了两种高级攻 - SunBlock:物联网系统的无云保护
使用人工智能工具结合经典的基于规则的流量过滤算法,在家庭路由器上本地有效地检测物联网威胁,实现对典型家庭物联网网络的保护,无需依赖云服务和第三方。
- Dig-CSI:一个分布式和生成模型辅助的 CSI 反馈训练框架
使用分布式生成器通过用户设备上传并使用局部数据进行训练,Dig-CSI 实现了具有较轻通信开销且性能可比的全局 CSI 反馈模型训练。
- 减少在线自我披露的隐私风险
通过鉴别和抽象,本文提出保护用户在线自披露隐私的方法,开发了一个包括 19 个自披露类别的分类方式,并建立了一个由 4.8K 注释披露跨度组成的大样本,通过微调语言模型,在 Token F1 上达到 75% 以上。进一步进行了用户研究,82 - 5G 网络与物联网设备:基于深度学习技术的缓解 DOS 攻击
近年来,物联网(IoT)设备的发展和实施加快。为了处理收集和传输到这些设备的大量数据,需要一个超级网络。第五代(5G)技术是一种新的综合无线技术,有可能成为 IoT 的主要推动技术。物联网设备的快速普及可能遇到许多安全限制和问题,因此出现了 - 医学影像联合学习中的隐私风险分析与缓解
提出了综合的医疗数据隐私风险分析和联邦学习(MedPFL)的减轻框架,分析了在联邦学习中保护私人医疗数据的隐私风险,并开发了有效的减轻策略。展示了使用联邦学习处理医学图像的实质性隐私风险,并指出在联邦学习中加入随机噪声的防御方法可能不总是有 - 通过自提示校准对精调大型语言模型进行实用的成员推断攻击
基于自校准概率变异的成员推断攻击(SPV-MIA)提出了一种新的对严格微调但无过拟合和隐私保护的 LLMs 泄露隐私的成员推断攻击方法。
- 智能电表数据共享的局部差分隐私
本文提出了一种新颖的局部差分隐私方法(称为 LDP-SmartEnergy),利用滑动窗口和随机响应技术,在不揭示个人用户的设备使用模式的情况下,促进了随时间共享设备级能耗数据。评估结果表明,与基准方法相比,LDP-SmartEnergy