Skip to main content
QUICK REVIEW

[論文レビュー] When Machine Learning Meets Privacy: A Survey and Outlook

Bo Liu, Ming Ding|arXiv (Cornell University)|Nov 24, 2020
Privacy-Preserving Technologies in Data参考文献 170被引用数 96
ひとこと要約

機械学習におけるプライバシー問題の包括的な調査で、MLの役割を保護対象、保護ツール、攻撃ツールに分類し、将来の研究方向を概説します。

ABSTRACT

The newly emerged machine learning (e.g. deep learning) methods have become a strong driving force to revolutionize a wide range of industries, such as smart healthcare, financial technology, and surveillance systems. Meanwhile, privacy has emerged as a big concern in this machine learning-based artificial intelligence era. It is important to note that the problem of privacy preservation in the context of machine learning is quite different from that in traditional data privacy protection, as machine learning can act as both friend and foe. Currently, the work on the preservation of privacy and machine learning (ML) is still in an infancy stage, as most existing solutions only focus on privacy problems during the machine learning process. Therefore, a comprehensive study on the privacy preservation problems and machine learning is required. This paper surveys the state of the art in privacy issues and solutions for machine learning. The survey covers three categories of interactions between privacy and machine learning: (i) private machine learning, (ii) machine learning aided privacy protection, and (iii) machine learning-based privacy attack and corresponding protection schemes. The current research progress in each category is reviewed and the key challenges are identified. Finally, based on our in-depth analysis of the area of privacy and machine learning, we point out future research directions in this field.

研究の動機と目的

  • 機械学習におけるプライバシーの最新動向を調査し、主要な課題を特定する。
  • プライバシーとMLの相互作用を3つの役割に分類する(private ML、ML支援のプライバシ保護、MLベースのプライバシ侵害)。
  • MLにおけるプライバシーへの攻撃、保護スキーム、協調学習アプローチを分析する。
  • プライバシー保護機械学習の今後の研究の指針と方向性を提供する。

提案手法

  • プライバシーにおけるMLの役割で既存研究を分類する(private ML、ML支援のプライバシ保護、MLベースのプライバシ攻撃)。
  • private MLにおける攻撃モデルと保護スキームを検討し、モデル/データのプライバシーやホワイトボックス/ブラックボックスなどの脅威設定を含む。
  • 機械学習のプライバシー保護技法として、暗号化、難読化/差分プライバシー、セキュア計算を論じる。
  • 分散・協調学習フレームワーク(フェデレーテッド学習、スプリット学習)とそのプライバシー影響を説明する。
  • ML支援のプライバシ保護手法とMLベースのプライバシ攻撃を要約し、今後の研究への洞察を提供する。

実験結果

リサーチクエスチョン

  • RQ1MLシステムにおける主なプライバシ脅威とMLのプライバシーにおける役割(モデル/データのプライバシー、保護ツールとしてのML、攻撃ツールとしてのML)は何か。
  • RQ2どのようなプライバシー保護技術とアーキテクチャ(暗号化、DP、SMC、フェデレーテッド/スプリット学習)がMLモデルとデータを効果的に保護するか。
  • RQ3既存研究はprivate ML、ML支援のプライバシ保護、MLベースのプライバシ攻撃の攻撃と保護をどのように分類・比較しているか。
  • RQ4非構造化データと高度なモデルを伴うMLのプライバシーにおける未解決課題と今後の方向性は何か。

主な発見

  • MLにおけるプライバシーは三つの相互作用する役割を含む:MLが保護対象、MLが保護ツール、MLが攻撃ツール。
  • プライベートML攻撃は訓練データのプライバシーとモデルのプライバシーに焦点を当て、脅威にはモデル抽出、特徴推定、メンバーシップ推定、モデル記憶化を含む。
  • DPおよび関連するプライバシー会計(moments accountant、Rényi DP)は中核的だが、機械学習、特に非構造化データには制約がある。
  • 暗号化(同型暗号を含む)と安全な多者計算はデータとモデルを保護できるが、計算・通信のオーバーヘッドが大きい。
  • 協調学習フレームワーク(フェデレーテッド学習、スプリット学習)はデータ露出を減らせるが、独自のプライバシリスクと対策ニーズを生み出す。
  • ML支援のプライバシ保護はプライバシリスクを特定し共有ポリシーを調整するためにMLを使用する一方、MLベースのプライバシ攻撃は敏感なデータを推測するためにMLの能力を利用する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。