Skip to main content
QUICK REVIEW

[논문 리뷰] PIR with Low Storage Overhead: Coding instead of Replication

Arman Fazeli, Alexander Vardy|arXiv (Cornell University)|2015. 05. 22.
Cryptography and Data Security참고 문헌 19인용 수 65
한 줄 요약

이 논문은 정보 이론적 비밀 유지 기반 개인 정보 검색(PIR)을 위한 새로운 프레임워크를 제안한다. 기존의 데이터베이스 복제 방식을 코딩 기반으로 대체함으로써 저장소 오버헤드를 극적으로 줄이고, 통신 복잡도와 정보 이론적 비밀 유지 성질을 유지한다. $k$-서버 PIR 코드를 사용해 데이터베이스의 코딩된 조각을 여러 서버에 분산 저장함으로써, 저장소 오버헤드는 점 渐진적으로 1에 수렴하며, 고정된 $k$에 대해 $1 + O(s^{-1/2})$의 오버헤드를 달성한다. 여기서 $s$는 데이터베이스 크기와 각 서버의 저장소 용량의 비율이다.

ABSTRACT

Private information retrieval (PIR) protocols allow a user to retrieve a data item from a database without revealing any information about the identity of the item being retrieved. Specifically, in information-theoretic $k$-server PIR, the database is replicated among $k$ non-communicating servers, and each server learns nothing about the item retrieved by the user. The cost of PIR protocols is usually measured in terms of their communication complexity, which is the total number of bits exchanged between the user and the servers, and storage overhead, which is the ratio between the total number of bits stored on all the servers and the number of bits in the database. Since single-server information-theoretic PIR is impossible, the storage overhead of all existing PIR protocols is at least $2$. In this work, we show that information-theoretic PIR can be achieved with storage overhead arbitrarily close to the optimal value of $1$, without sacrificing the communication complexity. Specifically, we prove that all known $k$-server PIR protocols can be efficiently emulated, while preserving both privacy and communication complexity but significantly reducing the storage overhead. To this end, we distribute the $n$ bits of the database among $s+r$ servers, each storing $n/s$ coded bits (rather than replicas). For every fixed $k$, the resulting storage overhead $(s+r)/s$ approaches $1$ as $s$ grows; explicitly we have $r\le k\sqrt{s}(1+o(1))$. Moreover, in the special case $k = 2$, the storage overhead is only $1 + \frac{1}{s}$. In order to achieve these results, we introduce and study a new kind of binary linear codes, called here $k$-server PIR codes. We then show how such codes can be constructed, and we establish several bounds on the parameters of $k$-server PIR codes. Finally, we briefly discuss extensions of our results to nonbinary alphabets, to robust PIR, and to $t$-private PIR.

연구 동기 및 목표

  • 기존의 $k$-서버 PIR 프로토콜에서 발생하는 높은 저장소 오버헤드 문제를 해결하기 위해, 이는 데이터베이스 복제로 인해 최소 $k$에 이르기 때문이다.
  • 통신 복잡도나 비밀 유지 보장을 희생시키지 않고 저장소 오버헤드를 1에 임의로 가까이 만들 수 있는 정보 이론적 PIR를 가능하게 하기 위해.
  • 기존의 모든 $k$-서버 PIR 프로토콜을 복제 대신 코딩된 저장소를 사용해 모방할 수 있는 일반적인 코딩 프레임워크를 개발하기 위해.
  • 질의 패턴을 통해 비밀 유지 검색을 지원하는 $k$-서버 PIR 코드—이를 바이너리 선형 코드로 구성하며, 데이터베이스의 각 비트가 서버들 사이에서 분리된 질의 집합들로부터 복구 가능하도록 설계하기 위해.
  • 코딩 이론 및 조합 설계를 통해 코드 매개변수의 상한을 설정하고, 명시적인 구성 방법을 제공하기 위해.

제안 방법

  • 데이터베이스 복제를 분산 코딩으로 대체: $s + r$개의 서버에 각각 $n/s$개의 코딩된 비트를 저장함으로써 기존의 $k$개의 전체 복제본 대신 저장한다.
  • 코딩된 $k$-서버 PIR 코드를 사용: 각 데이터베이스 비트가 서버들 사이에서 분리된 질의 집합 $k$개로부터 복구 가능한 바이너리 선형 코드이다.
  • 스테이너 시스템, 일단계 다수 결정 논리 복구 가능한 코드, 일정 무게 코드, 국소 복구 가능한 코드(LRCs)와 같은 조합 구조를 이용해 코드를 구성한다.
  • 각 서버가 질의의 무작위 부분집합만을 보게 하여 질의 패턴을 설계함으로써 비밀 유지 성질을 확보한다. 이는 $k$-서버 PIR의 비밀 유지 성질을 유지한다.
  • 가용성 $t = k-1$를 가진 LRC의 구조를 활용하여, 어떤 비트도 $k$개의 공모하지 않는 서버들로부터도 복구 가능하도록 보장한다.
  • 기존의 PIR 프로토콜을 코딩된 환경에 적응시키기 위해 원래의 질의를 코딩된 질의 벡터로 매핑함으로써 통신 복잡도와 비밀 유지 성질을 유지한다.

실험 결과

연구 질문

  • RQ1통신 비용을 증가시키지 않고 정보 이론적 $k$-서버 PIR를 저장소 오버헤드가 1에 임의로 가까이 올 수 있도록 달성할 수 있는가?
  • RQ2어떤 종류의 코드가 코딩된 저장소 환경에서 기존 PIR 프로토콜을 효율적으로 모방할 수 있는가?
  • RQ3$k$-서버 PIR 코드는 알려진 조합 구조 및 코딩 이론적 구조에서 어떻게 구성할 수 있는가?
  • RQ4$k$-서버 PIR 코드의 매개변수에 대한 기본 상한은 무엇이며, $k$와 $s$에 따라 어떻게 척도화되는가?
  • RQ5이 프레임워크는 강건한 PIR 및 코딩된 저장소를 사용한 $t$-비밀 유지 PIR로 확장될 수 있는가?

주요 결과

  • 저장소 오버헤드 $(s + r)/s$는 $s \to \infty$일 때 점 渐진적으로 1에 수렴하며, $r \leq k\sqrt{s}(1 + o(1))$ 조건을 만족하여 고정된 $k$에 대해 $1 + O(s^{-1/2})$의 오버헤드를 달성한다.
  • $k=2$일 경우 저장소 오버헤드는 정확히 $1 + \frac{1}{s}$이며, 이는 기존의 2배 복제 오버헤드에 비해 크게 향상된다.
  • 모든 알려진 $k$-서버 PIR 프로토콜은 동일한 통신 복잡도와 비밀 유지 보장을 유지하면서 코딩된 프레임워크를 통해 모의 구현이 가능하다.
  • 스테이너 시스템, 일단계 다수 결정 논리 복구 가능한 코드, 일정 무게 코드, LRCs를 사용해 $k$-서버 PIR 코드의 명시적 구성이 제공된다.
  • 비이진 알파벳의 경우 이진 경우보다 최소 거리를 향상시킬 수 있다. 예를 들어 $GF(4)$에서 $s=2, k=3$일 경우 최소 거리 4를 달성할 수 있으며, 이는 이진 경우의 3보다 높다.
  • 이 프레임워크는 강건한 PIR 및 $t$-비밀 유지 PIR로 확장 가능하며, 최대 $\ell - k$개의 서버 응답이 손실되거나 공모 서버가 존재하더라도 비밀 유지 성질을 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.