QUICK REVIEW

[논문 리뷰] The Capacity of Private Information Retrieval with Partially Known Private Side Information

Yi-Peng Wei, Karim Banawan|arXiv (Cornell University)|2017. 10. 02.

Cryptography and Data Security참고 문헌 33인용 수 21

한 줄 요약

이 논문은 부분적으로 알려진 개인적 측면 정보를 가진 프라이빗 인포메이션 리콜(PIR)을 연구한다. 사용자가 N개의 상호작용하지 않는 데이터베이스에서 메시지를 캐시하고, 원하는 메시지를 신원을 드러내지 않고 검색하는 시스템을 다룬다. 저자들은 정확한 PIR 용량을 유도한다: $ C = \left(1 + \frac{1}{N} + \cdots + \frac{1}{N^{K-M-1}}\right)^{-1} = \frac{1 - \frac{1}{N}}{1 - \left(\frac{1}{N}\right)^{K-M}} $, 이는 같은 데이터베이스가 캐싱 및 검색 단계를 모두 담당하더라도 성능 손실이 없다는 것을 보여준다.

ABSTRACT

We consider the problem of private information retrieval (PIR) of a single message out of $K$ messages from $N$ replicated and non-colluding databases where a cache-enabled user (retriever) of cache-size $M$ possesses side information in the form of full messages that are partially known to the databases. In this model, the user and the databases engage in a two-phase scheme, namely, the prefetching phase where the user acquires side information and the retrieval phase where the user downloads desired information. In the prefetching phase, the user receives $m_n$ full messages from the $n$th database, under the cache memory size constraint $\sum_{n=1}^N m_n \leq M$. In the retrieval phase, the user wishes to retrieve a message such that no individual database learns anything about the identity of the desired message. In addition, the identities of the side information messages that the user did not prefetch from a database must remain private against that database. Since the side information provided by each database in the prefetching phase is known by the providing database and the side information must be kept private against the remaining databases, we coin this model as extit{partially known private side information}. We characterize the capacity of the PIR with partially known private side information to be $C=\left(1+\frac{1}{N}+\cdots+\frac{1}{N^{K-M-1}} ight)^{-1}=\frac{1-\frac{1}{N}}{1-(\frac{1}{N})^{K-M}}$. Interestingly, this result is the same if none of the databases knows any of the prefetched side information, i.e., when the side information is obtained externally, a problem posed by Kadhe et al. and settled by Chen-Wang-Jafar recently. Thus, our result implies that there is no loss in using the same databases for both prefetching and retrieval phases.

연구 동기 및 목표

사용자가 데이터베이스에서 측면 정보를 사전 캐시하고 이후에 원하는 메시지를 프라이빗하게 검색하는 이중 단계 시스템에서 프라이빗 인포메이션 리콜(PIR)을 모델링하고 분석하는 것.
개별 데이터베이스가 원하는 메시지의 신원이나 캐시되지 않은 측면 정보 메시지의 신원을 알 수 없도록 보장하는 프라이버시 보장을 위한 조건 설정.
데이터베이스가 사용자의 캐시된 콘텐츠에 부분적인 지식을 가진 경우, PIR의 정보이론적 용량을 특성화하는 것.
캐싱과 검색 단계에 동일한 데이터베이스를 사용할 경우, 외부 캐싱 대비 용량 손실이 발생하는지 여부를 규명하는 것.

제안 방법

이중 단계 PIR 모델을 수식화: 캐싱 단계(사용자가 데이터베이스 n에서 $ m_n $개의 메시지를 캐시하며, $ \sum m_n \leq M $ 를 만족)와 검색 단계(사용자가 프라이빗하게 한 메시지를 검색).
프라이버시 제약 조건을 적용: 각 데이터베이스가 원하는 메시지의 신원이나 자신에게서 캐시되지 않은 $ M - m_n $개 메시지의 신원을 파악하지 못하도록 보장.
측면 정보를 활용하기 위해 MDS 코딩된 질의를 사용하는 구현 가능한 방법을 제안하여 다운로드 비용을 최소화하면서도 프라이버시를 유지.
조합적 질의 설계를 통해 정규화된 다운로드 비용 유도: $ p = \frac{1}{N-1}(N^{K-m} - 1) $, $ q = \frac{1}{N-1}(N^{(N-1)m} - 1) $, 그리고 $ L = N^{K-m} $ 는 원하는 메시지에 대한 값.
유도된 하한과 일치하는 역증명을 유도하기 위해 귀납법과 정보이론적 부등식을 사용한 증명을 수립.
기존 연구들과 비교하여 필드 크기와 서브패킷화 요구사항을 분석하여 제안된 방법의 우수성을 입증.

실험 결과

연구 질문

RQ1데이터베이스가 사용자의 캐시된 측면 정보에 부분적인 지식을 가진 경우 PIR의 용량은 얼마인가?
RQ2캐시되지 않은 측면 정보 메시지의 프라이버시 보장이 외부 캐싱 대비 성능 저하를 초래하는가?
RQ3캐싱과 검색에 동일한 데이터베이스를 사용할 경우 PIR 용량에 손실이 발생하는가?
RQ4부분적으로 알려진 측면 정보의 구조가 달성 가능한 다운로드 비용에 어떤 영향을 미치는가?
RQ5데이터베이스가 사용자의 측면 정보를 알고, 모른다, 또는 부분적으로 안다는 세 가지 모델 간에 용량에 본질적인 차이가 존재하는가?

주요 결과

부분적으로 알려진 개인적 측면 정보를 가진 PIR의 용량은 $ C = \left(1 + \frac{1}{N} + \cdots + \frac{1}{N^{K-M-1}}\right)^{-1} = \frac{1 - \frac{1}{N}}{1 - \left(\frac{1}{N}\right)^{K-M}} $ 로 유도되며, 이는 완전히 알려지지 않은 측면 정보를 가진 PIR의 용량과 동일하다.
캐시 메모리 제약 조건 $ \sum m_n \leq M $ 가 등호로 만족된다면, 특정 캐싱 전략에 관계없이 용량이 달성된다.
제안된 방법은 외부 캐싱을 사용한 기존 방법과 동일한 용량을 달성하며, 이는 캐싱과 검색에 동일한 데이터베이스를 사용하더라도 성능 저하가 없다는 것을 의미한다.
더 작은 필드 크기와 서브패킷화 요구사항을 가진 새로운 MDS 코딩된 검색 방법을 제안하였으며, 특히 균일한 캐싱 전략 하에서 유리하다.
결과적으로 데이터베이스가 부분적인 측면 정보를 알고 있더라도 PIR 용량이 감소하지 않으며, 이는 캐싱과 검색에 동일한 데이터베이스를 사용하는 것이 가능하다는 것을 시사한다.
역증명을 통해 유도된 용량의 최적성을 확인하였으며, 귀납법과 정보이론적 경계(예: 한의 부등식)를 활용하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.