QUICK REVIEW

[論文レビュー] Parameter Privacy-Preserving Data Sharing: A Particle-Belief MDP Formulation

Haokun Yu, Jingyuan Zhou|arXiv (Cornell University)|Feb 4, 2026

Privacy-Preserving Technologies in Data被引用数 0

ひとこと要約

論文はパラメータプライバシー保護を目的としたデータ共有を信念MDPとして定式化し、連続状態を扱うための粒子信念アプローチを導入。ガウス混合に基づくMI上限を用いて最適化を実行可能にし、混合自動機 platoonの実験でパラメータ流出を抑えつつ利便性を維持。

ABSTRACT

This paper investigates parameter-privacy-preserving data sharing in continuous-state dynamical systems, where a data owner designs a data-sharing policy to support downstream estimation and control while preventing adversarial inference of a sensitive parameter. This data-sharing problem is formulated as an optimization problem that trades off privacy leakage and the impact of data sharing on the data owner's utility, subject to a data-usability constraint. We show that this problem admits an equivalent belief Markov decision process (MDP) formulation, which provides a simplified representation of the optimal policy. To efficiently characterize information-theoretic privacy leakage in continuous state and action spaces, we propose a particle-belief MDP formulation that tracks the parameter posterior via sequential Monte Carlo, yielding a tractable belief-state approximation that converges asymptotically as the number of particles increases. We further derive a tractable closed-form upper bound on particle-based MI via Gaussian mixture approximations, which enables efficient optimization of the particle-belief MDP. Experiments on a mixed-autonomy platoon show that the learned continuous policy substantially impedes inference attacks on human-driving behavior parameters while maintaining data usability and system performance.

研究の動機と目的

敏感なパラメータに関する情報流出を最小化してデータ共有ポリシーを開発する。
ディストーション制約の下でパラメータプライバシーとデータの有用性・システム性能のバランスを取る。
連続空間で最適ポリシーを扱いやすくする信念空間再表現を提供する。
連続データ共有のためのMIを推定・境界付けするためのスケーラブルで扱いやすい方法を提供する。

提案手法

データ共有問題を元の最適化問題と同値の信念MDPとして定式化する。
パラメータ後方分布を追跡し連続状態動作を可能にする粒子信念（Sequential Monte Carlo）近似を導入する。
共有データを生成しMI計算を扱いやすくするためガウスデータ共有ポリシーを採用する。
ガウス混合近似を用いた粒子ベースのMIの閉形式上限を導出する（KL/ Chernoff境界）。
より厳密な推定のためにKLベースのエントロピーとガウスベースのエントロピーを切替える制度適応的MI上限を開発する（定理11）。
粒子数が大きくなると粒子信念ベルマン方程式が真の信念MDP値へ漸近収束することを証明する。

実験結果

リサーチクエスチョン

RQ1連続状態のダイナミクスに対するデータ共有ポリシーにパラメータプライバシーをどう組み込めるか？
RQ2信念MDP定式化はプライバシーと有用性のトレードオフおよびデータ共有のフィードバック効果を捉えられるか？
RQ3連続空間で敏感パラメータの信念を粒子フィルタリングで扱いやすく更新できるか？
RQ4プライバシー有用性目的を効率的に最適化する有効なMI境界は何か？
RQ5提案手法は混合自動 platoonのような現実的シナリオにも拡張でき、利便性と性能を維持できるか？

主な発見

信念MDPの定式化はパラメータプライバシー最適化問題を等価に表現し、履歴に依存しない最適ポリシーを可能にする（定理1）。
Sequential Monte Carloを用いた粒子信念アプローチは信念状態の扱いやすい近似を提供し、粒子数の増加と共に真の信念へ収束する（補題4・5; 定理8）。
ガウスデータ共有ポリシーにより連続データ生成が可能になり、ガウス混合によるMI推定が扱いやすくなる（式14-15）。
粒子MIの1ステップあたりの境界をKLベースおよびChernoffベースの境界で導出し、制度適応的な精緻化を行う（定理9および定理11）。
このフレームワークは、悪意的推定を低下させつつデータ有用性とシステム性能を維持する実用的ポリシーを生み出し、混合自動 platoon実験で実証される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。