Skip to main content
QUICK REVIEW

[论文解读] Private Information Retrieval from MDS Coded Databases with Colluding Servers under Several Variant Models

Yiwei Zhang, Gennian Ge|arXiv (Cornell University)|May 9, 2017
Cryptography and Data Security参考文献 32被引用 36
一句话总结

该论文提出了一种适用于MDS编码数据库的通用私有信息检索(PIR)方案,涵盖四种变体模型:鲁棒服务器、拜占庭服务器、多文件检索以及任意共谋模式。通过利用MDS码和结构化查询设计,该方案在 $ R = \Delta/b $ 的条件下实现了 $ (1 + R + R^2 + \cdots + R^{M-1})^{-1} $ 的PIR速率,其中 $ \Delta $ 为共谋服务器可访问的最大查询块数,$ b $ 为查询组数量。

ABSTRACT

Private information retrieval (PIR) gets renewed attentions due to its information-theoretic reformulation and its application in distributed storage system (DSS). The general PIR model considers a coded database containing $N$ servers storing $M$ files. Each file is stored independently via the same arbitrary $(N,K)$-MDS code. A user wants to retrieve a specific file from the database privately against an arbitrary set of $T$ colluding servers. A key problem is to analyze the PIR capacity, defined as the maximal number of bits privately retrieved per one downloaded bit. Several extensions for the general model appear by bringing in various additional constraints. In this paper, we propose a general PIR scheme for several variant PIR models including: PIR with robust servers, PIR with Byzantine servers, the multi-file PIR model and PIR with arbitrary collusion patterns.

研究动机与目标

  • 解决在MDS编码数据与共谋服务器存在的分布式存储系统中的私有信息检索挑战。
  • 将PIR模型扩展至包含实际变体:鲁棒服务器(擦除)、拜占庭服务器(错误)、多文件检索以及任意共谋模式。
  • 设计一种通用PIR方案,在多种系统约束与共谋模型下保持隐私性。
  • 在确保任意指定共谋模式下信息论隐私的前提下,实现高检索速率。
  • 将先前关于PIR容量的研究结果推广至 $ K \geq 2 $ 且 $ T \geq 2 $ 的非退化情形。

提出的方法

  • 通过使用 $ b $ 个互不相交的 $ K $-子集服务器来构建查询结构,以均衡分配查询并确保检索可行性。
  • 使用MDS码将文件数据编码分布于服务器之间,使得任意 $ K $ 个服务器即可恢复原始数据。
  • 设计查询向量,使得每份文件的码字(编码数据单元)在 $ \mathbb{F}_q^L $ 中表示为随机向量,从而确保不同文件之间的不可区分性。
  • 利用MDS性质消除干扰:通过某一区块的查询恢复其他区块缺失的数据,尤其在多文件与鲁棒服务器模型中有效。
  • 通过使任一共谋服务器集合对任意文件的码字系数向量在统计上不可区分,从而确保隐私性。
  • 将PIR速率公式化为 $ (1 + R + R^2 + \cdots + R^{M-1})^{-1} $,其中 $ R = \Delta / b $,$ \Delta $ 为任一共谋服务器集合可访问的最大查询块数。

实验结果

研究问题

  • RQ1当服务器可能为鲁棒(非响应)或拜占庭(恶意)时,MDS编码数据库中可实现的PIR速率是多少?
  • RQ2如何设计PIR方案以支持多文件的同时检索,同时保持隐私与效率?
  • RQ3能否构建一种统一的PIR方案,适用于任意共谋模式,而不仅限于均匀的 $ T $-共谋?
  • RQ4在具有异构服务器行为的编码数据库中,下载成本与隐私之间的基本权衡是什么?
  • RQ5查询块结构与MDS编码如何协同作用,以在服务器故障或对抗行为下实现隐私保护与数据恢复?

主要发现

  • 所提出的PIR方案实现了 $ (1 + R + R^2 + \cdots + R^{M-1})^{-1} $ 的速率,其中 $ R = \Delta / b $,$ \Delta $ 为任一共谋服务器集合可访问的最大查询块数。
  • 在多文件PIR模型中,该方案优于独立执行单文件PIR方案的性能,尤其当检索 $ P \geq 2 $ 个文件时更为显著。
  • 在鲁棒服务器模型中,只要查询结构通过MDS恢复机制考虑了擦除情况,即使有 $ S $ 个服务器失效,该方案仍能确保数据检索成功。
  • 在拜占庭服务器模型中,该方案可通过MDS码的冗余性与结构化查询设计,检测并恢复错误响应。
  • 只要 $ b > \Delta $,该方案即使在任意共谋模式下仍能保持信息论隐私,确保共谋服务器无法区分不同文件。
  • 在 $ (25,20) $-MDS 编码系统中,该方案实现了 $ 5/9 $ 的速率,优于通用 $ T=2 $-共谋方案的 $ 10/19 $ 速率,验证了速率的提升效果。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。