CodedPrivateML：分布式机器学习的快速隐私保护框架

Feb, 2019

CodedPrivateML：分布式机器学习的快速隐私保护框架

CodedPrivateML: A Fast and Privacy-Preserving Framework for Distributed Machine Learning

Jinhyun So, Basak Guler, A. Salman Avestimehr

TL;DR介绍了一种名为 CodedPrivateML 的机器学习模型训练方法，该方法保护数据和模型的隐私并允许分布式训练，并实验表明其在逻辑回归方面的收敛效果以及相比基于多方计算 (MPC) 的密码学方法有重大速度提升。

Abstract

How to train a machine learning model while keeping the data private and secure? We present codedprivateml, a fast and scalable approach to this critical problem. →

machine learning privacy codedprivateml logistic regression speedup

发现论文，激发创造

隐私保护协作机器学习的可扩展方法

该研究提出了 COPML 算法，这是一个完全去中心化的训练框架，可以保护数据隐私并实现可伸缩性，使用对个体数据进行安全编码的方式在多方之间分发计算负载，并以分布式方式执行训练计算和模型更新。实验演示了 COPML 相较于基准协议在训练速度上可实现高达 16 倍的加速。

Nov, 2020

多源私有数据上的高效深度学习

Myelin 是一种深度学习框架，它结合了安全和隐私保护原则，使用可信硬件区域和差分隐私等技术以实现完全私密的机器学习模型训练。

Jul, 2018

可扩展的隐私保护分布式学习

使用多方同态加密技术实现，SPINDLE 是第一种覆盖完整机器学习工作流程的，可进行联合梯度下降执行和模型评估，并在保护数据和模型机密性方面具有无侵入者的被动攻击模型，为分布式数据集上的广义线性模型的培训和评估提供了一种高效保证隐私的解决方案。

May, 2020

使用 TensorFlow 进行基因组数据隐私保护协作机器学习

研究利用安全多方计算技术，设计和实现了多个安全多方计算友好的机器学习基元，包括类别权重调整和可并行近似激活函数，以解决在基因组研究中由于涉及到多方数据协作，数据隐私和机密性等问题。该研究在 iDASH2019 安全基因组分析竞赛的第四组别获得第一名。

Feb, 2020

个性化和私密的点对点机器学习

本文提出了一种高效的分散式（点对点）和异步算法来解决个性化模型的学习，同时满足强隐私要求，并证明了它的收敛速率。我们展示了如何使算法往常差异保持私密以保护个人数据集的信息披露，并正式分析了效用和隐私之间的权衡。实验结果表明，在非私密约束下，我们的方法大大优于以前的工作，在隐私约束下，我们可以显著改进在独立学习中得到的模型。

May, 2017

野心勃勃：隐私保护神经网络训练的可重复研究

这项工作主要关注机器学习模型的训练阶段，在这个阶段对用户数据的隐私保护至关重要。我们提供了坚实的理论背景，以便更容易理解当前方法及其局限性。此外，我们对最新的模型训练框架进行了详细比较，提供了在标准基准上独特属性和性能的全面对比。我们重现了一些论文的结果，并考察现有作品对开放科学的支持程度，认为我们的工作就提高了关于隐私保护机器学习在理论进展和实际应用之间差距的意识，特别是在开放源代码可用性、可重复性和可用性方面。

Mar, 2024

CaPC Learning: 保密和私密的协同学习

我们提出一种名为 CaPC 的机器学习方法，通过使用安全的多方计算和同态加密等技术，实现在协作学习环境中同时满足数据保密性和隐私性的要求，各方不需要显式地加入其培训集或训练集中央模型，且每个参与者都能够获得更高的准确性和公正性。

Feb, 2021

TensorFlow 中使用安全计算实现私密机器学习

本文提出了一个针对安全多方计算（secure multi-party computation）在 TensorFlow 平台下的实验框架，并提供了一种开源的最新协议实现方式及具体案例，以及使用 typical 私有机器学习模型方面的基准测试结果。

Oct, 2018

Hawk：使用安全查找表计算的精确且快速的隐私保护机器学习

训练具有多个实体的机器学习模型，并且在没有直接数据共享的情况下，可以解决由于业务、法律或道德限制而受阻的应用。本文设计和实施了新的隐私保护机器学习协议，用于逻辑回归和神经网络模型。我们采用了两个服务器模型，在数据所有者之间进行数据密钥共享，由这两个服务器进行联合数据的模型训练和评估。现有方法中存在的低效和不准确的重要方法是使用 Yao 噪声电路来计算非线性激活函数的来源。我们提出了基于密钥共享的查找表的计算非线性函数的新方法，既提供了计算效率，又提高了准确性。此外，我们还提出了一种针对隐私保护机器学习的放宽安全措施的探索。我们认为，在计算过程中，虽然有关于查找表访问模式的一些信息被透露，但它仍然保持 epsilon-dX 隐私。利用这种放松可显著减少训练所需的计算资源。我们提出了针对这种放松安全范式量身定制的加密协议，并定义和分析泄漏。我们的评估结果表明，我们的逻辑回归协议比 SecureML 快 9 倍，神经网络训练速度比 SecureML 快 688 倍。值得注意的是，我们的神经网络在 15 个周期内在 MNIST 数据集上实现了 96.6% 的准确率，超过了以往在相同架构下准确率为 93.4% 的基准。

Mar, 2024

Pencil: 私密且可扩展的协作学习，无需无合谋假设

Pencil 是第一种为协作学习提供数据隐私、模型隐私和可扩展性的私有训练框架，无需依赖于非勾结假设。

Mar, 2024