Skip to main content
QUICK REVIEW

[論文レビュー] Privacy-Adversarial User Representations in Recommender Systems.

Yehezkel S. Resheff, Yanai Elazar|arXiv (Cornell University)|Jul 10, 2018
Privacy-Preserving Technologies in Data被引用数 1
ひとこと要約

本論文は、推薦システムにおけるユーザー表現からの個人情報(性別や年齢など)の漏洩を低減するプライバシーに反発するフレームワークを提案する。ユーザー埋め込みを、推薦性能を維持しつつ情報漏洩を最小限に抑えるように敵対的トレーニングすることで、ベンチマークデータ上でプライバシーと有用性の間の顕著なトレードオフ低減を達成した。

ABSTRACT

Latent factor models for recommender systems represent users and items as low dimensional vectors. Privacy risks have been previously studied mostly in the context of recovery of personal information in the form of usage records from the training data. However, the user representations themselves may be used together with external data to recover private user information such as gender and age. In this paper we show that user vectors calculated by a common recommender system can be exploited in this way. We propose the privacy-adversarial framework to eliminate such leakage, and study the trade-off between recommender performance and leakage both theoretically and empirically using a benchmark dataset. We briefly discuss further applications of this method towards the generation of deeper and more insightful recommendations.

研究の動機と目的

  • 潜在的要因に基づく推薦システムにおけるユーザー埋め込みから、性別や年齢などのプライベートなユーザー属性がどのように推定可能かを調査すること。
  • 訓練データが直接公開されていない場合でも、標準的なユーザー表現学習に内在するプライバシー漏洩を是正すること。
  • 推薦精度を著しく低下させることなく、ユーザー埋め込みからの属性漏洩を最小限に抑えるフレームワークを開発すること。
  • ユーザー表現における推薦性能とプライバシー漏洩のトレードオフを、実証的および理論的に分析すること。

提案手法

  • ユーザー埋め込みが属性推定攻撃に対して耐性を持つように最適化される、プライバシーに反発するトレーニングフレームワークを導入する。
  • 敵対的ディスクライマーを用いて、ユーザー埋め込みからの機微な属性の漏洩を特定し、それを最小化する。
  • 二重目的最適化を採用:一つは推薦性能(例:行列分解損失)を目的とし、もう一つは属性推定に対する敵対的損失(プライバシー目的)を目的とする。
  • ユーティリティとプライバシーのトレードオフを評価するために、標準ベンチマークデータセットにフレームワークを適用する。
  • 推薦精度と属性予測可能性の両立を図るため、統合目的関数を用いてユーザー埋め込みをトレーニングする。
  • 推薦品質(例:RMSE、AUC)とプライバシー(例:属性推定精度)の両方の標準評価指標を用いる。

実験結果

リサーチクエスチョン

  • RQ1標準的なユーザー埋め込みから、性別や年齢などのプライベートなユーザー属性がどの程度正確に推定可能か。
  • RQ2推薦品質を著しく損なうことなく、このような属性推定のリスクを低減するには、ユーザー表現をどのように変更すべきか。
  • RQ3ユーザー埋め込みに敵対的正則化を適用した場合、推薦性能とプライバシー漏洩の間のトレードオフはどのように変化するか。
  • RQ4提案されたフレームワークは、実世界のベンチマークデータセットに効果的に適用可能であり、実用的有用性を維持できるか。

主な発見

  • 標準的な推薦システムからのユーザー埋め込みは、性別や年齢などの機微な属性を高い正確性で推定可能である。
  • 提案されたプライバシーに反発するフレームワークは、属性推定精度をベースライン水準にまで著しく低下させ、プライバシー漏洩を効果的に制限した。
  • 推薦性能とプライバシーの間の有利なトレードオフを達成し、高い有用性を維持しながら機微情報の露出を最小限に抑えた。
  • ベンチマークデータセットにおける実証的結果から、フレームワークが推薦品質の著しい低下を伴わずに漏洩を効果的に抑制することが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。