Skip to main content
QUICK REVIEW

[论文解读] The Capacity of Private Information Retrieval from Decentralized Uncoded Caching Databases

Yi-Peng Wei, Batuhan Arasli|arXiv (Cornell University)|Nov 27, 2018
Caching and Content Delivery参考文献 65被引用 8
一句话总结

本文研究了从去中心化非编码缓存数据库中的私有信息检索(PIR),其中数据库独立地以均匀随机方式缓存比特。研究证明,原本用于去中心化编码缓存的均匀随机缓存方案,可实现最优的归一化下载成本,其表达式为 $ rac{D}{L} = rac{1}{N+1} inom{N}{n-1} u^{n-1}(1- u)^{N+1-n} ig(1 + rac{1}{n} + rac{1}{n^2} + rac{1}{n^{K-1}}ig)$,并通过新颖的下界推导技术与反向界完全匹配。

ABSTRACT

We consider the private information retrieval (PIR) problem from decentralized uncoded caching databases. There are two phases in our problem setting, a caching phase, and a retrieval phase. In the caching phase, a data center containing all the K files, where each file is of size L bits, and several databases with storage size constraint 𝜇𝐾𝐿 bits exist in the system. Each database independently chooses 𝜇𝐾𝐿 bits out of the total 𝐾𝐿 bits from the data center to cache through the same probability distribution in a decentralized manner. In the retrieval phase, a user (retriever) accesses N databases in addition to the data center, and wishes to retrieve a desired file privately. We characterize the optimal normalized download cost to be 𝐷∗=∑𝑁+1𝑛=1(𝑁𝑛−1)𝜇𝑛−1(1−𝜇)𝑁+1−𝑛(1+1𝑛+⋯+1𝑛𝐾−1). We show that uniform and random caching scheme which is originally proposed for decentralized coded caching by Maddah-Ali and Niesen, along with Sun and Jafar retrieval scheme which is originally proposed for PIR from replicated databases surprisingly results in the lowest normalized download cost. This is the decentralized counterpart of the recent result of Attia, Kumar, and Tandon for the centralized case. The converse proof contains several ingredients such as interference lower bound, induction lemma, replacing queries and answering string random variables with the content of distributed databases, the nature of decentralized uncoded caching databases, and bit marginalization of joint caching distributions.

研究动机与目标

  • 表征从去中心化非编码缓存数据库中私有信息检索的最优归一化下载成本。
  • 确定原本为去中心化编码缓存提出、均匀且随机的缓存方案,是否在PIR场景下实现最小期望下载成本。
  • 建立与可实现方案相匹配的反向证明,从而精确刻画去中心化缓存下PIR系统的容量。
  • 通过将查询与应答变量替换为数据库内容,将复制数据库的PIR下界技术扩展至去中心化非编码缓存系统。

提出的方法

  • 提出两阶段系统:去中心化缓存阶段,每个数据库独立地从数据中心均匀随机存储 µKL 比特;检索阶段,用户访问 N 个数据库及数据中心。
  • 对子文件 Wj,S 依次应用 Sun-Jafar PIR 方案,其中 S 表示存储文件 Wj 比特的数据库集合。
  • 通过将查询与应答的随机变量替换为实际数据库内容,推导出归一化下载成本的下界,扩展了文献 [44] 的技术。
  • 利用比特边际化方法,并结合各数据库间缓存的独立性,推导出每比特期望缓存内容的下界。
  • 应用拉格朗日优化,在存储约束下最小化熵项之和,表明相等的缓存概率(µ)可使目标最小化。
  • 通过证明可实现方案的成本与下界完全匹配,建立匹配的反向证明,从而证明最优性。

实验结果

研究问题

  • RQ1均匀且随机的缓存方案是否最小化了从去中心化非编码缓存数据库中进行PIR时的期望归一化下载成本?
  • RQ2能否将集中式PIR中编码缓存的下界技术适配至去中心化非编码缓存系统?
  • RQ3在存储约束 µ 下,去中心化非编码缓存系统中PIR问题的精确容量(最优归一化下载成本)是多少?
  • RQ4去中心化缓存的结构如何影响PIR中存储与下载成本之间的权衡?

主要发现

  • 尽管该方案最初是为编码缓存设计,但均匀随机缓存方案在PIR阶段仍能最小化期望归一化下载成本。
  • 最优归一化下载成本恰好为 $\frac{D}{L} = \sum_{n=1}^{N+1} \binom{N}{n-1} \mu^{n-1}(1-\mu)^{N+1-n} \left(1 + \frac{1}{n} + \cdots + \frac{1}{n^{K-1}}\right)$,与反向界完全一致。
  • 反向证明表明,不存在其他缓存概率分布能获得更低的期望下载成本,从而证明了均匀随机方案的最优性。
  • 下界通过将查询与应答变量替换为实际数据库内容推导得出,充分利用了非编码与去中心化缓存的特性。
  • 在比特级缓存概率上应用拉格朗日松弛法,表明相等的缓存概率 µ 可使界中的熵项最小化。
  • 该结果将集中式PIR容量结果推广至去中心化场景,表明在去中心化条件下,同一方案仍为最优。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。