QUICK REVIEW

[论文解读] Linear Symmetric Private Information Retrieval for MDS Coded Distributed Storage with Colluding Servers

Qiwen Wang, Mikael Skoglund|arXiv (Cornell University)|Aug 17, 2017

Cryptography and Data Security参考文献 14被引用 40

一句话总结

本文提出了一种针对具有T-共谋服务器的MDS编码分布式存储的线性对称私有信息检索（SPIR）方案，在服务器之间共享足够公共随机性的情况下，实现了信息论容量 $1 - \frac{M+T-1}{N}$。该方案通过结构化查询设计与随机化，确保用户隐私和数据库隐私，实现高效检索而不泄露所请求文件的内容。

ABSTRACT

The problem of symmetric private information retrieval (SPIR) from a coded database which is distributively stored among colluding servers is studied. Specifically, the database comprises $K$ files, which are stored among $N$ servers using an $(N,M)$-MDS storage code. A user wants to retrieve one file from the database by communicating with the $N$ servers, without revealing the identity of the desired file to any server. Furthermore, the user shall learn nothing about the other $K-1$ files in the database. In the $T$-colluding SPIR problem (hence called TSPIR), any $T$ out of $N$ servers may collude, that is, they may communicate their interactions with the user to guess the identity of the requested file. We show that for linear schemes, the information-theoretic capacity of the MDS-TSPIR problem, defined as the maximum number of information bits of the desired file retrieved per downloaded bit, equals $1-\frac{M+T-1}{N}$, if the servers share common randomness (unavailable at the user) with amount at least $\frac{M+T-1}{N-M-T+1}$ times the file size. Otherwise, the capacity equals zero. We conjecture that our capacity holds also for general MDS-TSPIR schemes.

研究动机与目标

解决在服务器可能共谋以推断所请求文件的分布式存储系统中，私有文件检索的挑战。
将对称私有信息检索（SPIR）扩展至T共谋下的MDS编码数据库，确保用户和数据库的隐私。
推导在这些约束条件下线性SPIR方案的信息论容量，特别是基于共享公共随机性的假设。
推测所推导的容量适用于一般（非线性）MDS-TSPIR方案，推广先前关于非共谋和复制数据库的研究结果。

提出的方法

基于移位单位向量结构设计查询矩阵 $\mathbf{E}$，以在 $N$ 个服务器之间检索所请求文件符号的线性组合。
通过独立矩阵 $\tilde{\mathbf{U}}^{(r)}$ 的随机化，隐藏查询模式，确保用户隐私。
引入 $M(M+T-1)$ 个在服务器之间共享但用户未知的独立随机符号 $S_j^{(r)}$，以保护数据库隐私。
通过将公共随机性的多项式函数加入答案，构造查询向量与存储数据的内积，确保统计均匀性。
利用MDS码的特性，确保任意 $T$ 个共谋服务器接收到的查询向量呈均匀随机分布，从而防止推断所请求文件。
通过求解 $M$ 轮通信形成的 $M(N-M-T+1)$ 个线性方程组，实现所请求文件的解码。

实验结果

研究问题

RQ1在具有 $T$ 个共谋服务器的MDS编码分布式存储系统中，线性对称私有信息检索的最大检索速率（容量）是多少？
RQ2在MDS-TSPIR问题中，为实现非零容量，服务器之间需要共享多少公共随机性？
RQ3能否将线性方案中推导出的容量推广至一般（非线性）MDS-TSPIR方案？
RQ4容量如何随服务器数量 $N$、存储码参数 $M$ 和共谋容忍度 $T$ 变化？
RQ5在共谋环境下，私有检索的存储效率（通过MDS编码实现）与通信成本之间存在何种权衡？

主要发现

假设服务器之间共享足够公共随机性，线性MDS-TSPIR问题的信息论容量为 $1 - \frac{M+T-1}{N}$。
如果共享公共随机性的数量小于文件大小的 $\frac{M+T-1}{N-M-T+1}$ 倍，则容量降为零。
通过MDS码特性和随机化，该方案确保任意 $T$ 个共谋服务器观察到的查询向量呈均匀随机分布，从而实现用户隐私。
由于答案中包含用户未知且均匀分布的独立随机符号 $S_j^{(r)}$，数据库隐私得以保持。
用户通过求解 $M$ 轮通信生成的 $M(N-M-T+1)$ 个线性方程组，成功解码所请求文件 $W_1$。
该结果推广了先前工作：当 $T=1$ 时退化为非共谋情形，且当 $M=1$ 和 $T=1$ 时与已知的复制数据库结果一致。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。