[论文解读] Low Latency Privacy Preserving Inference
论文介绍 LoLa,一种基于同态加密的低延迟私有推理方法,可显著提升私有神经网络预测的速度,以及一种迁移学习方法,使深层表示上的私有推理延时约为 0.16 秒。
When applying machine learning to sensitive data, one has to find a balance between accuracy, information security, and computational-complexity. Recent studies combined Homomorphic Encryption with neural networks to make inferences while protecting against information leakage. However, these methods are limited by the width and depth of neural networks that can be used (and hence the accuracy) and exhibit high latency even for relatively simple networks. In this study we provide two solutions that address these limitations. In the first solution, we present more than $10 imes$ improvement in latency and enable inference on wider networks compared to prior attempts with the same level of security. The improved performance is achieved by novel methods to represent the data during the computation. In the second solution, we apply the method of transfer learning to provide private inference services using deep networks with latency of $\sim0.16$ seconds. We demonstrate the efficacy of our methods on several computer vision tasks.
研究动机与目标
- 在私有神经网络推理中权衡准确性、数据隐私和计算效率。
- 提高延迟和内存使用效率,优于以往基于 HE 的私有推理方法,同时保持安全性。
- 在更宽更深的网络上实现私有推理且不牺牲准确性。
- 通过深层表示探索私有推理,以减少噪声增长和消息大小。
- 在标准视觉基准数据集(MNIST、CIFAR-10)和 CalTech-101 上演示实用的私有预测。
提出的方法
- 使用同态加密(BFV 方案)在加密数据上执行神经网络计算。
- 将加密数据表示为多种数据表示形式(密集、稀疏、交错、卷积、堆叠),并切换表示以优化矩阵-向量乘法。
- 开发并应用针对每种表示的矩阵-向量乘法技术(dense-ROW、sparse-COL、stacked-ROW、interleaved-ROW、convolution 表示)。
- 在 MNIST 上通过将输入编码为卷积表示,并进行逐层运算,使用旋转和加法来最小化延迟和内存使用,来演示 LoLa。
- 对 CIFAR-10 应用 LoLa,使用大网络,在内存限制下 CryptoNets 不现实的情况下证明可行性。
- 提出通过深层表示的私有推理(迁移学习),其中深度网络将数据预处理为紧凑特征表示,然后对其进行加密以进行私有评估;在 CalTech-101 上验证,延迟 0.16 秒,类别平衡准确率 81.6%。
实验结果
研究问题
- RQ1LoLa 能否在 128 位安全设置下,在保持可比精度的同时,显著低于 CryptoNets 的延迟?
- RQ2不同的加密数据表示如何影响延迟、内存使用,以及对更宽更深网络的可扩展性?
- RQ3通过深层表示的迁移学习在大规模视觉任务的私有推断中是否可行?
- RQ4在将私有推断应用于标准视觉数据集(MNIST、CIFAR-10)和迁移学习场景时,实际的性能权衡是什么?
主要发现
- LoLa 实现私有 MNIST 推理,最短 2.2 秒,比 CryptoNets 快约 11 倍,总体快约 93 倍。
- LoLa 使在更宽的网络上进行推理成为可能,并显著降低内存使用,相较 CryptoNets,在 RAM 限制下使 CIFAR-10 规模成为可能。
- LoLa-Dense 与 LoLa-Small 变体提供不同的延迟-精度权衡,LoLa 在 128 位安全下达到 2.2s 延迟和 98.95% 的 MNIST 准确率。
- 基于深层表示的迁移学习私有推理方法可在 CalTech-101 上实现 0.16 秒私有预测,类别平衡准确率 81.6%。
- CryptoNets 原始延迟为每次预测 205s,改进的 SEAL 实现后降至 24.8s;LoLa 进一步降低,同时保持高准确率(MNIST 约 98.95%)。
- 本文展示了在 MNIST 和 CIFAR-10 基准上的私有推理,突出了相较于现有基于 HE 的方法在延迟和内存效率上的显著提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。