Skip to main content
QUICK REVIEW

[论文解读] Secure Computation for Machine Learning With SPDZ

Valerie Chen, Valerio Pastro|arXiv (Cornell University)|Jan 2, 2019
Cryptography and Data Security参考文献 9被引用 44
一句话总结

本论文评估 SPDZ 多方计算框架在安全 ML 中的应用,显示与明文和先前的 MPC 方法相比具有相当的准确性,并且在效率方面明显优于 Obliv-C,且可扩展到更大规模的问题。

ABSTRACT

Secure Multi-Party Computation (MPC) is an area of cryptography that enables computation on sensitive data from multiple sources while maintaining privacy guarantees. However, theoretical MPC protocols often do not scale efficiently to real-world data. This project investigates the efficiency of the SPDZ framework, which provides an implementation of an MPC protocol with malicious security, in the context of popular machine learning (ML) algorithms. In particular, we chose applications such as linear regression and logistic regression, which have been implemented and evaluated using semi-honest MPC techniques. We demonstrate that the SPDZ framework outperforms these previous implementations while providing stronger security.

研究动机与目标

  • 在隐私约束下,当数据在多方之间分割时,推动 ML 的安全计算。
  • 在常见 ML 任务(线性回归和逻辑回归)上评估 SPDZ 框架并与半信任 MPC 方法进行比较。
  • 分析安全 ML 实现中准确性、精度和运行时间之间的权衡。
  • 证明 SPDZ 在多方设置和更大数据集上的可扩展性。

提出的方法

  • 在 SPDZ 框架中实现 ML 算法(通过 CGD/LDLT/Cholesky 的线性回归,以及通过 SGD 的逻辑回归)。
  • 使用定点算术以避免浮点开销,并采用迭代方法(CGD)求解线性系统。
  • 对线性和逻辑回归应用小批量 SGD,并采用对 MPC 友好的激活函数和近似。
  • 将 SPDZ 结果与明文验证及先前的 MPC 方法(Obliv-C)在 MNIST 和 Arcene 等数据集上进行比较。
  • 在 2、3、4 方分区和在 AWS EC2 部署上进行评估,以评估可扩展性。

实验结果

研究问题

  • RQ1SPDZ 能否提供针对 ML 任务的恶意安全 MPC,其准确性是否可与明文训练相媲美?
  • RQ2在不同数据维度和参与方数量下,线性回归和逻辑回归的时延和准确性,SPDZ 的表现如何?
  • RQ3达到与非安全或半信任基线同等水平,SPDZ 需要什么精度和迭代深度?
  • RQ4在可扩展性和 RMSE 方面,SPDZ 与 Obliv-C 及先前的 MPC 方法相比如何?
  • RQ5在 SPDZ 内,对安全逻辑回归可用的激活/近似选项有哪些?

主要发现

  • SPDZ 相对于 Obliv-C,在 LDLT、Cholesky 和 CGD 的准确性相当,在较大矩阵规模下的运行时间快一个数量级。
  • 在使用 SGD 进行安全 ML 时,SPDZ 产生的 RMSE 低于 Obliv-C,且通常优于现有的 CGD/SGD 结果。
  • SGD 的准确性/精度要求取决于数据;MNIST 在大约 13 比特的精度下达到接近明文的准确度,而 Arcene 需要大约 28 比特。
  • 对于逻辑回归,提出的新的激活函数在测试数据集上在 SPDZ 中并未优于基于泰勒展开的近似。
  • 在 UCI 数据集上,SPDZ 28 位精度的 SGD 显示的 RMSE 与明文相当,且有中等开销(RMSE 增加 5–20%)。
  • 在本地网络的三方和四方(垂直分区)运行时间,以及两方 EC2 部署,表明 SPDZ 随着参与方增多和矩阵增大而具有合理的可扩展性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。