[论文解读] Linear Symmetric Private Information Retrieval for MDS Coded Distributed Storage with Colluding Servers
本文提出了一种针对具有T-共谋服务器的MDS编码分布式存储的线性对称私有信息检索(SPIR)方案,在服务器之间共享足够公共随机性的情况下,实现了信息论容量 $1 - \frac{M+T-1}{N}$。该方案通过结构化查询设计与随机化,确保用户隐私和数据库隐私,实现高效检索而不泄露所请求文件的内容。
The problem of symmetric private information retrieval (SPIR) from a coded database which is distributively stored among colluding servers is studied. Specifically, the database comprises $K$ files, which are stored among $N$ servers using an $(N,M)$-MDS storage code. A user wants to retrieve one file from the database by communicating with the $N$ servers, without revealing the identity of the desired file to any server. Furthermore, the user shall learn nothing about the other $K-1$ files in the database. In the $T$-colluding SPIR problem (hence called TSPIR), any $T$ out of $N$ servers may collude, that is, they may communicate their interactions with the user to guess the identity of the requested file. We show that for linear schemes, the information-theoretic capacity of the MDS-TSPIR problem, defined as the maximum number of information bits of the desired file retrieved per downloaded bit, equals $1-\frac{M+T-1}{N}$, if the servers share common randomness (unavailable at the user) with amount at least $\frac{M+T-1}{N-M-T+1}$ times the file size. Otherwise, the capacity equals zero. We conjecture that our capacity holds also for general MDS-TSPIR schemes.
研究动机与目标
- 解决在服务器可能共谋以推断所请求文件的分布式存储系统中,私有文件检索的挑战。
- 将对称私有信息检索(SPIR)扩展至T共谋下的MDS编码数据库,确保用户和数据库的隐私。
- 推导在这些约束条件下线性SPIR方案的信息论容量,特别是基于共享公共随机性的假设。
- 推测所推导的容量适用于一般(非线性)MDS-TSPIR方案,推广先前关于非共谋和复制数据库的研究结果。
提出的方法
- 基于移位单位向量结构设计查询矩阵 $\mathbf{E}$,以在 $N$ 个服务器之间检索所请求文件符号的线性组合。
- 通过独立矩阵 $\tilde{\mathbf{U}}^{(r)}$ 的随机化,隐藏查询模式,确保用户隐私。
- 引入 $M(M+T-1)$ 个在服务器之间共享但用户未知的独立随机符号 $S_j^{(r)}$,以保护数据库隐私。
- 通过将公共随机性的多项式函数加入答案,构造查询向量与存储数据的内积,确保统计均匀性。
- 利用MDS码的特性,确保任意 $T$ 个共谋服务器接收到的查询向量呈均匀随机分布,从而防止推断所请求文件。
- 通过求解 $M$ 轮通信形成的 $M(N-M-T+1)$ 个线性方程组,实现所请求文件的解码。
实验结果
研究问题
- RQ1在具有 $T$ 个共谋服务器的MDS编码分布式存储系统中,线性对称私有信息检索的最大检索速率(容量)是多少?
- RQ2在MDS-TSPIR问题中,为实现非零容量,服务器之间需要共享多少公共随机性?
- RQ3能否将线性方案中推导出的容量推广至一般(非线性)MDS-TSPIR方案?
- RQ4容量如何随服务器数量 $N$、存储码参数 $M$ 和共谋容忍度 $T$ 变化?
- RQ5在共谋环境下,私有检索的存储效率(通过MDS编码实现)与通信成本之间存在何种权衡?
主要发现
- 假设服务器之间共享足够公共随机性,线性MDS-TSPIR问题的信息论容量为 $1 - \frac{M+T-1}{N}$。
- 如果共享公共随机性的数量小于文件大小的 $\frac{M+T-1}{N-M-T+1}$ 倍,则容量降为零。
- 通过MDS码特性和随机化,该方案确保任意 $T$ 个共谋服务器观察到的查询向量呈均匀随机分布,从而实现用户隐私。
- 由于答案中包含用户未知且均匀分布的独立随机符号 $S_j^{(r)}$,数据库隐私得以保持。
- 用户通过求解 $M$ 轮通信生成的 $M(N-M-T+1)$ 个线性方程组,成功解码所请求文件 $W_1$。
- 该结果推广了先前工作:当 $T=1$ 时退化为非共谋情形,且当 $M=1$ 和 $T=1$ 时与已知的复制数据库结果一致。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。