Hawk：使用安全查找表计算的精确且快速的隐私保护机器学习

Mar, 2024

Hawk：使用安全查找表计算的精确且快速的隐私保护机器学习

Hawk: Accurate and Fast Privacy-Preserving Machine Learning Using Secure Lookup Table Computation

Hamza Saleem, Amir Ziashahabi, Muhammad Naveed, Salman Avestimehr

TL;DR训练具有多个实体的机器学习模型，并且在没有直接数据共享的情况下，可以解决由于业务、法律或道德限制而受阻的应用。本文设计和实施了新的隐私保护机器学习协议，用于逻辑回归和神经网络模型。我们采用了两个服务器模型，在数据所有者之间进行数据密钥共享，由这两个服务器进行联合数据的模型训练和评估。现有方法中存在的低效和不准确的重要方法是使用 Yao 噪声电路来计算非线性激活函数的来源。我们提出了基于密钥共享的查找表的计算非线性函数的新方法，既提供了计算效率，又提高了准确性。此外，我们还提出了一种针对隐私保护机器学习的放宽安全措施的探索。我们认为，在计算过程中，虽然有关于查找表访问模式的一些信息被透露，但它仍然保持 epsilon-dX 隐私。利用这种放松可显著减少训练所需的计算资源。我们提出了针对这种放松安全范式量身定制的加密协议，并定义和分析泄漏。我们的评估结果表明，我们的逻辑回归协议比 SecureML 快 9 倍，神经网络训练速度比 SecureML 快 688 倍。值得注意的是，我们的神经网络在 15 个周期内在 MNIST 数据集上实现了 96.6% 的准确率，超过了以往在相同架构下准确率为 93.4% 的基准。

Abstract

Training machine learning models on data from multiple entities without direct data sharing can unlock applications otherwise hindered by business, legal, or ethical constraints. In this work, we design and implement new privacy-preserving machine learning protocols for →

privacy-preserving machine learning logistic regression neural network models secret-shared lookup tables relaxed security measures

发现论文，激发创造

野心勃勃：隐私保护神经网络训练的可重复研究

这项工作主要关注机器学习模型的训练阶段，在这个阶段对用户数据的隐私保护至关重要。我们提供了坚实的理论背景，以便更容易理解当前方法及其局限性。此外，我们对最新的模型训练框架进行了详细比较，提供了在标准基准上独特属性和性能的全面对比。我们重现了一些论文的结果，并考察现有作品对开放科学的支持程度，认为我们的工作就提高了关于隐私保护机器学习在理论进展和实际应用之间差距的意识，特别是在开放源代码可用性、可重复性和可用性方面。

Mar, 2024

低延迟隐私保护推理

该研究在机器学习应用到敏感数据时，结合同态加密技术和神经网络提供了两种解决方案，分别是提高深度和宽度相对较高的网络精度和降低网络推理的延迟时间以提供更好的隐私保障。这两种方案应用于几个计算机视觉任务，并获得了良好的效果。

Dec, 2018

PrivLogit：通过调整数值优化器实现高效的隐私保护逻辑回归

提出了一种定制化的数值优化方法，结合加密协议，可以在保障数据安全和隐私的前提下，实现分布式和隐私保护的逻辑回归，并且在性能和精确度不降低的同时，取得了显著的加速效果。

Nov, 2016

BLAZE：高速隐私保护机器学习

本文介绍了一种基于安全外包计算的隐私保护机器学习方法，BLAZE，适用于线性回归、逻辑回归和神经网络等常用机器学习算法，实现了更好的安全性和更快的运行速度，在 WAN 和 LAN 设置下，性能明显优于 ABY3。

May, 2020

基于隐私保护的神经架构搜索

使用安全多方计算方法构建隐私保护的神经架构搜索框架，其中使用重新设计的 ReLU 和 Max-pooling 保混乱电路以及对秘密共享的 Softmax 函数的新替代方法，分析和实验表明其在安全性，效率和准确性方面具有优越性。

Apr, 2022

多源私有数据上的高效深度学习

Myelin 是一种深度学习框架，它结合了安全和隐私保护原则，使用可信硬件区域和差分隐私等技术以实现完全私密的机器学习模型训练。

Jul, 2018

无窥视：私有分布式深度学习综述

本文研究了分布式深度学习的多种方法，以保护数据的机密性，同时还允许服务器训练模型。在神经网络的背景下，比较了联邦学习，分离式学习和大批量随机梯度下降等多种方法，以及差分隐私、同态加密、遗忘传输和混淆电路等安全方法，讨论了它们在计算资源、数据泄露和通信效率方面的优缺点，并分享了未来的趋势。

Dec, 2018

Trident: 高效的 4PC 框架用于隐私保护机器学习

提出了一种用于隐私保护机器学习的安全四方协议和框架，在广泛使用的四种机器学习算法上进行了应用，并在离线 - online 模式下操作。实验结果表明，在 LAN 和 WAN 环境下，与现有方法相比，该框架在训练和预测阶段的效果提高了 187 倍和 158 倍。

Dec, 2019

TensorFlow 中使用安全计算实现私密机器学习

本文提出了一个针对安全多方计算（secure multi-party computation）在 TensorFlow 平台下的实验框架，并提供了一种开源的最新协议实现方式及具体案例，以及使用 typical 私有机器学习模型方面的基准测试结果。

Oct, 2018

Tabula: 安全神经网络推断的非线性激活函数的高效计算

该研究通过采用安全查找表的算法 Tabula，代替使用加密电路进行神经网络推断所需的非线性激活函数加密计算，以此降低了通信、存储和运行成本，并在安全神经网络推断时实现了显著的性能提升。

Mar, 2022