Skip to main content
QUICK REVIEW

[論文レビュー] V3DB: Audit-on-Demand Zero-Knowledge Proofs for Verifiable Vector Search over Committed Snapshots

Zipeng Qiu, Wenjie Qu|arXiv (Cornell University)|Mar 3, 2026
Cryptography and Data Security被引用数 0
ひとこと要約

V3DBは、コミット済みスナップショット上で簡潔なZK証明を用いた検証可能でバージョン管理されたベクトル検索を提供し、プライベートデータを公開せずにIVF-PQ検索の監査・正確性を要求に応じて検証可能にします。

ABSTRACT

Dense retrieval services increasingly underpin semantic search, recommendation, and retrieval-augmented generation, yet clients typically receive only a top-$k$ list with no auditable evidence of how it was produced. We present V3DB, a verifiable, versioned vector-search service that enables audit-on-demand correctness checks for approximate nearest-neighbour (ANN) retrieval executed by a potentially untrusted service provider. V3DB commits to each corpus snapshot and standardises an IVF-PQ search pipeline into a fixed-shape, five-step query semantics. Given a public snapshot commitment and a query embedding, the service returns the top-$k$ payloads and, when challenged, produces a succinct zero-knowledge proof that the output is exactly the result of executing the published semantics on the committed snapshot -- without revealing the embedding corpus or private index contents. To make proving practical, V3DB avoids costly in-circuit sorting and random access by combining multiset equality/inclusion checks with lightweight boundary conditions. Our prototype implementation based on Plonky2 achieves up to $22\times$ faster proving and up to $40\%$ lower peak memory consumption than the circuit-only baseline, with millisecond-level verification time. Github Repo at https://github.com/TabibitoQZP/zk-IVF-PQ.

研究の動機と目的

  • outsourced dense retrievalにおける説明責任ギャップを、コミット済みスナップショット上のトップ-k結果の検証可能な証明を可能にすることで解消する。
  • ZK証明に適合する固定形状のIVF-PQ五段階クエリセマンティクスを標準化する。
  • マルチセットベースの証明を通じてインサー Circuit のソートやランダムアクセスを回避し、証明コストを削減する。
  • 現実的な性能向上を持つスケーラブルな証明バックエンドを、回路のみベースラインより提供する。
  • Plonky2ベースのプロトタイプと公開GitHubリポジトリでエンドツーエンドの実現性をデモする。

提案手法

  • IVF-PQを固定形状の五段階クエリセマンティクスに標準化する(セントロイド距離、プローブ選択、ADCテーブル構築、PQルックアップスコアリング、最終的なトップ-k抽出)。
  • 列ごとの容量とパディングを有効にする固定形状のインデックス成形パイプラインを実装する。
  • バージョンを結びつけつつプライバシーを保つために、二部構成の公開スナップショットコミットメント(IVFレイアウトのMerkleルートとPQコードブックのハッシュダイジェスト)を使用する。
  • 二つの回路インスタンスを提案する:回路のみのベースラインと、コストのかかるソート/選択を回路の外に移動させるマルチセット等価/包含と境界チェックを用いた最適化設計。
  • Plonky2を用いてエンドツーエンドの証明コストを評価し、回路ベースラインに対して最大約22倍の証明高速化とピークメモリ削減約40%を示し、検証はミリ秒レベルで行える。

実験結果

リサーチクエスチョン

  • RQ1コミット済みスナップショット上でプライベートデータを公開せずに検証可能かつ監査可能なベクトル検索を実現するにはどうすればよいか?
  • RQ2IVF-PQを succinct ZK証明向けの固定形状セマンティクスに再定義できるか?
  • RQ3正確性とプライバシーを維持しつつ、ZK証明の密集検索における証明コストを低減する技術は?
  • RQ4この文脈でマルチセットベースの証明と回路のみベースラインの現実的な性能向上はどの程度か?

主な発見

  • コミット済みスナップショット上でのデンス検索の検証可能なバージョン管理型ベクトルデータベースと、 succinct ZK証明を用いた検証。
  • 固定形状の五段階IVF-PQセマンティクスにより証明生成が効率化される。
  • マルチセットベースの証明は、回路のみベースラインと比べて証明時間を最大約22倍、ピークメモリを約40%削減。
  • 検証は依然としてミリ秒レベルで行われ、コーパスやプライベートインデックス内容を公開しない。
  • プロトタイプ実装(回路のみベースラインと最適化マルチセット設計)は、監査要求に対する実用的な証明をデモし、再現性のための公開GitHubリポジトリが提供されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。