Skip to main content
QUICK REVIEW

[论文解读] HEAX: High-Performance Architecture for Computation on Homomorphically Encrypted Data in the Cloud

M. Sadegh Riazi, Kim Laine|arXiv (Cornell University)|Jan 1, 2019
Cryptography and Data Security被引用 3
一句话总结

HEAX 提出了一种高性能硬件架构,用于全同态加密(FHE),通过利用多级并行性,实现了相较于软件实现164–268倍的加速。该架构包含一种新颖且高度可并行化的数论变换(NTT)引擎,以及一种端到端的流水线化设计,显著降低了片上内存使用量,从而实现了云环境中实用的FHE计算。

ABSTRACT

With the rapid increase in cloud computing, concerns surrounding data privacy, security, and confidentiality also have been increased significantly. Not only cloud providers are susceptible to internal and external hacks, but also in some scenarios, data owners cannot outsource the computation due to privacy laws such as GDPR, HIPAA, or CCPA. Fully Homomorphic Encryption (FHE) is a groundbreaking invention in cryptography that, unlike traditional cryptosystems, enables computation on encrypted data without ever decrypting it. However, the most critical obstacle in deploying FHE at large-scale is the enormous computation overhead. In this paper, we present HEAX, a novel hardware architecture for FHE that achieves unprecedented performance improvement. HEAX leverages multiple levels of parallelism, ranging from ciphertext-level to fine-grained modular arithmetic level. Our first contribution is a new highly-parallelizable architecture for number-theoretic transform (NTT) which can be of independent interest as NTT is frequently used in many lattice-based cryptography systems. Building on top of NTT engine, we design a novel architecture for computation on homomorphically encrypted data. We also introduce several techniques to enable an end-to-end, fully pipelined design as well as reducing on-chip memory consumption. Our implementation on reconfigurable hardware demonstrates 164-268x performance improvement for a wide range of FHE parameters.

研究动机与目标

  • 为解决由于高计算开销导致的全同态加密(FHE)在云计算中的关键性能瓶颈。
  • 在受GDPR、HIPAA和CCPA等法规约束的隐私敏感环境中,实现FHE的实际部署。
  • 设计一种硬件架构,支持在不进行解密的情况下对加密数据进行高效、可扩展且安全的计算。
  • 在保持FHE工作负载高吞吐量的同时,减少片上内存消耗。
  • 通过实现端到端流水线化,最大化硬件利用率和吞吐量。

提出的方法

  • 设计一种专为格密码学和FHE优化的新型、高度可并行化的数论变换(NTT)引擎。
  • 通过在密文、数据通路和模算术运算之间实现多级并行性,以最大化吞吐量。
  • 引入端到端流水线化架构,以维持高利用率并减少FHE计算中的空闲周期。
  • 通过数据重用和内存访问调度技术,优化片上内存使用。
  • 利用可重构硬件(FPGA)实现FHE原 primitive 和操作的灵活且高效的映射。
  • 将NTT引擎与FHE计算单元整合为一个协同的、可扩展的硬件流水线,用于同态运算。

实验结果

研究问题

  • RQ1如何有效利用多级并行性来加速硬件上的FHE计算?
  • RQ2能否设计一种高度可并行化的NTT架构,作为FHE加速器的基础构建模块?
  • RQ3在FHE系统中,为实现端到端流水线化并减少片上内存占用,需要哪些硬件优化?
  • RQ4与基于软件的FHE实现相比,使用定制硬件可实现多大程度的性能提升?
  • RQ5所提出的架构在广泛的FHE参数集上如何实现可扩展性?

主要发现

  • HEAX 在广泛的FHE参数集上,相较于基于软件的FHE实现,实现了164–268倍的性能提升。
  • 所提出的NTT引擎实现了高吞吐量和低延迟,适用于多种格密码学系统。
  • 成功实现了端到端流水线化,支持连续数据处理,最大化硬件利用率。
  • 通过优化的数据访问和重用策略,显著减少了片上内存消耗。
  • 该硬件设计在不同FHE参数配置下表现出强大的可扩展性和效率。
  • 该架构可部署于可重构硬件上,实现了真实云环境中同态加密的实用加速。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。