[论文解读] HEAX: An Architecture for Computing on Encrypted Data
HEAX 提出了一种用于全同态加密(FHE)的新型硬件架构,通过利用多级并行性,实现了相较于基于软件的 FHE 164–268 倍的性能提升,包括高度可并行化的数论变换(NTT)引擎和减少片上内存的端到端流水线化设计。该架构针对可重构硬件进行了优化,能够在保持安全性和可扩展性的前提下,实现对加密数据的高效计算。
With the rapid increase in cloud computing, concerns surrounding data privacy, security, and confidentiality also have been increased significantly. Not only cloud providers are susceptible to internal and external hacks, but also in some scenarios, data owners cannot outsource the computation due to privacy laws such as GDPR, HIPAA, or CCPA. Fully Homomorphic Encryption (FHE) is a groundbreaking invention in cryptography that, unlike traditional cryptosystems, enables computation on encrypted data without ever decrypting it. However, the most critical obstacle in deploying FHE at large-scale is the enormous computation overhead. In this paper, we present HEAX, a novel hardware architecture for FHE that achieves unprecedented performance improvement. HEAX leverages multiple levels of parallelism, ranging from ciphertext-level to fine-grained modular arithmetic level. Our first contribution is a new highly-parallelizable architecture for number-theoretic transform (NTT) which can be of independent interest as NTT is frequently used in many lattice-based cryptography systems. Building on top of NTT engine, we design a novel architecture for computation on homomorphically encrypted data. We also introduce several techniques to enable an end-to-end, fully pipelined design as well as reducing on-chip memory consumption. Our implementation on reconfigurable hardware demonstrates 164-268x performance improvement for a wide range of FHE parameters.
研究动机与目标
- 解决全同态加密(FHE)中限制其大规模部署的关键性能瓶颈。
- 设计一种硬件架构,实现在云环境中对加密数据进行高效、可扩展且安全的计算。
- 通过从密文级别到细粒度模算术的多级并行性,降低 FHE 的计算开销。
- 在支持端到端流水线化执行 FHE 操作的同时,最小化片上内存消耗。
- 提供一种实用的可重构硬件解决方案,加速基于格的密码原_primitive(如 NTT 和 FHE)
提出的方法
- 设计一种新颖的、高度可并行化的数论变换(NTT)引擎,专为 FHE 工作负载优化。
- 实现一种流水线化架构,支持同态操作的端到端执行且无停顿。
- 引入内存优化技术,减少大密文所需片上存储空间。
- 在多个处理单元之间利用数据级和指令级并行性,加速 NTT 和模算术运算。
- 使用可重构硬件(FPGA)对 HEAX 架构进行原型设计与评估,覆盖多种 FHE 参数集。
- 应用模算术优化,降低多项式乘法及其他核心 FHE 操作的延迟。
实验结果
研究问题
- RQ1如何有效利用硬件级并行性以加速全同态加密(FHE)?
- RQ2FHE 系统中为减少内存占用并实现流水线执行,需要哪些架构优化?
- RQ3可重构硬件平台是否能显著超越基于软件的 FHE 实现,取得性能提升?
- RQ4与现有软件和硬件设计相比,所提出的 NTT 引擎在吞吐量和资源利用率方面表现如何?
- RQ5HEAX 架构在不同 FHE 参数集下,能在多大程度上保持低延迟和高吞吐量的同时实现可扩展性?
主要发现
- HEAX 在多种 FHE 参数集下,相较于基于软件的 FHE 实现,性能提升达 164–268 倍。
- 所提出的 NTT 引擎实现了高吞吐量、低延迟的多项式算术,这对基于格的 FHE 方案至关重要。
- 端到端流水线化减少了空闲周期,提高了硬件利用率,实现了持续的高吞吐量。
- 通过数据布局和缓冲优化,显著降低了片上内存消耗,提升了可扩展性。
- 该架构在可重构硬件(FPGA)上表现出强大的可扩展性和效率,具备实际部署的可行性。
- HEAX 设计具有通用性,可广泛应用于其他基于格的密码系统,而不仅限于 FHE。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。