Skip to main content
QUICK REVIEW

[論文レビュー] A Survey of Privacy Threats and Defense in Vertical Federated Learning: From Model Life Cycle Perspective

Lei Yu, Meng Han|arXiv (Cornell University)|Feb 6, 2024
Privacy-Preserving Technologies in Data被引用数 5
ひとこと要約

Vertical Federated Learning (VFL)におけるプライバシー脅威と防御の包括的な調査。モデルライフサイクルに基づき、分類法と実務者向けのガイダンスを提供。

ABSTRACT

Vertical Federated Learning (VFL) is a federated learning paradigm where multiple participants, who share the same set of samples but hold different features, jointly train machine learning models. Although VFL enables collaborative machine learning without sharing raw data, it is still susceptible to various privacy threats. In this paper, we conduct the first comprehensive survey of the state-of-the-art in privacy attacks and defenses in VFL. We provide taxonomies for both attacks and defenses, based on their characterizations, and discuss open challenges and future research directions. Specifically, our discussion is structured around the model's life cycle, by delving into the privacy threats encountered during different stages of machine learning and their corresponding countermeasures. This survey not only serves as a resource for the research community but also offers clear guidance and actionable insights for practitioners to safeguard data privacy throughout the model's life cycle.

研究の動機と目的

  • VFLのプライバシー脅威のライフサイクルに基づく構造化された分類法を提供する。
  • VFLのプライバシー課題をHFLと区別し、固有の攻撃ベクトルを特定する。
  • VFLプライバシーの防御機構(暗号技術と非暗号技術)を調査・整理する。
  • VFLプライバシーの未解決課題、ギャップ、今後の研究方向を強調する。

提案手法

  • VFLのプライバシー脅威を特徴推測攻撃、ラベル推測攻撃、モデル抽出攻撃に分類する。
  • 攻撃者の知識、行動、能力(ホワイトボックス/ブラックボックス/グレー・ボックス、内部関係者の脅威)を説明する。
  • VFLアーキテクチャ(Aggregate VFLとSplit VFL)と役割(アクティブ/パッシブパーティ、コーディネーター)を概説する。
  • 機械学習ライフサイクルの段階(環境アクセス、データ前処理、訓練、展開、推論)に脅威と防御を対応付ける。
  • 暗号的(同形暗号/機能暗号/セキュアMPC)と非暗号的アプローチを含む防御機構の分類を提供し、信頼できる第三者、訓練管理、協調、ハードウェアといった防御能力を議論する。
  • VFLプライバシーを分割学習と関連づけ、データプライバシーの実践的保護への示唆を議論する。
Figure 1. Different Phases of Machine Learning Life-cycle
Figure 1. Different Phases of Machine Learning Life-cycle

実験結果

リサーチクエスチョン

  • RQ1モデルライフサイクル全体でのVertical Federated Learningにおける明確なプライバシー脅威は何か?
  • RQ2VFLにおけるプライバシーリスクは水平型FLとどのように異なり、どのような固有の防御戦略が有効か?
  • RQ3VFLプライバシーを保護するために提案されている防御機構(暗号的および非暗号的)は何で、要件とトレードオフは何か?
  • RQ4VFLのプライバシーを守るための未解決課題と今後の方向性は何か?

主な発見

  • VFLは中間結果の直接的な交換と整列サンプル間の特徴相関のため、HFLよりもより複雑なプライバシー問題を提起する。
  • ライフサイクルベースの観点は、環境アクセス、データ前処理(エンティティ整合を含む)、訓練、推論、展開の各段階で脅威ベクトルと対応する対策を明らかにする。
  • 暗号防御(例:同形加密、機能暗号、セキュアMPC)と非暗号防御が調査され、それらの能力とトレードオフ(信頼できる第三者、訓練の制御、協調、ハードウェア)について議論された。
  • VFLアーキテクチャはAggregate VFLとSplit VFLに分類され、プライバシーリスクと防御の適用に影響を与える。
  • 攻撃者モデルには内部関係者の敵(アクティブ、パッシブ、共謀)を含むとともに、ホワイトボックス、ブラックボックス、グレー・ボックスのシナリオを含み、勾配/逆、代理モデル攻撃などの戦略を含む。
  • 本調査は、VFLプライバシー脅威をHFLと区別する包括的な分類法を提供し、モデルライフサイクル全体でデータプライバシーを保護するための実務家向けガイダンスを提供する。
Figure 2. Entity alignment in Data Processing phase.
Figure 2. Entity alignment in Data Processing phase.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。