Skip to main content
QUICK REVIEW

[論文レビュー] If you are not paying for it, you are the product: How much do advertisers pay to reach you?

Panagiotis Papadopoulos, Nicolas Kourtellis|arXiv (Cornell University)|Jan 24, 2017
Privacy, Security, and Data Protection参考文献 30被引用数 48
ひとこと要約

本論文は、ブラウザ拡張機能を用いて平文および暗号化されたリアルタイム入札(RTB)価格を監視することで、プログラム型オンライン広告における広告主が個々のユーザーに到達するために支払う金額をリアルタイムで推定する新規の手法を提示する。プローブ広告キャンペーンのデータを用いてモデルを学習することで、暗号化された価格がある場合でも、ユーザーの広告価値を82%以上の精度で推定でき、個人データに裏付けられた広告経済の透明性を実現する。

ABSTRACT

Online advertising is progressively moving towards a programmatic model in which ads are matched to actual interests of individuals collected as they browse the web. Letting the huge debate around privacy aside, a very important question in this area, for which little is known, is: How much do advertisers pay to reach an individual? In this study, we develop a first of its kind methodology for computing exactly that -- the price paid for a web user by the ad ecosystem -- and we do that in real time. Our approach is based on tapping on the Real Time Bidding (RTB) protocol to collect cleartext and encrypted prices for winning bids paid by advertisers in order to place targeted ads. Our main technical contribution is a method for tallying winning bids even when they are encrypted. We achieve this by training a model using as ground truth prices obtained by running our own "probe" ad-campaigns. We design our methodology through a browser extension and a back-end server that provides it with fresh models for encrypted bids. We validate our methodology using a one year long trace of 1600 mobile users and demonstrate that it can estimate a user's advertising worth with more than 82% accuracy.

研究の動機と目的

  • 個人データに基づいて広告主が個々のユーザーに付与する金銭的価値を特定するというデジタル広告の価格透明性の欠如に取り組む。
  • RTBエコシステム全体で特定のユーザーを標的とする広告主が実際に支払うコストをリアルタイムで推定する、ユーザー中心の手法を開発する。
  • 現代の広告プラットフォームでは、既存の手法が無効となる暗号化されたRTB入札価格を測定する課題を克服する。
  • 1,600人の実際のモバイルユーザーの1年間分のトレースと2つの実世界の広告キャンペーンを用いて、手法の妥当性を検証する。
  • ユーザー、規制当局、企業が、オンライン広告における個人データの真の経済的価値をデータドリブンな洞察で把握できるように支援する。

提案手法

  • ブラウザ拡張機能を用いて、広告オークション中、リアルタイムで平文および暗号化されたRTB価格のお知らせを受動的に監視する。
  • 制御されたプローブ広告キャンペーンから収集した真値の価格を用いて、機械学習モデルを学習する。このキャンペーンは、平文と暗号化の両方の価格を提供する広告交換所を標的としている。
  • RTB入札リクエストおよびレスポンスから抽出した特徴量を用いて、価格が暗号化されている場合でも、当該入札の勝者価格を予測する。
  • バックエンドサーバー上でモデルを動的に更新することで、広告交換所の行動や暗号化パターンの変化に適応する。
  • 1,600人の実際のモバイルユーザーの12か月分の実際のユーザー閲覧データトレースを用いて、手法を検証する。
  • 本手法は、すべての測定価格がコスト・パー・インプレッション(CPM)モデルに基づくと仮定しており、ユーザーあたりの最大コストを推定する。

実験結果

リサーチクエスチョン

  • RQ1暗号化された入札価格がある場合でも、リアルタイムのプログラム型広告において、広告主が個々のユーザーに到達するために実際に支払う金額はどれほどか?
  • RQ2受動的でクライアント側の測定システムは、広告リクエストおよびレスポンスサイクルからの観察可能な特徴量のみを用いて、暗号化されたRTB入札価格を正確に推定できるか?
  • RQ3平文および暗号化された入札データを併用した場合の、ユーザーの広告価値推定の正確さはどの程度か?
  • RQ4暗号化された入札データを含めることで、平文データのみに依存する手法と比較して、ユーザーの財務的価値の全体的な推定値にどのような影響があるか?
  • RQ5ユーザー単位のリアルタイムシステムは、個人データに裏付けられた広告経済の透明性をどの程度提供できるか?

主な発見

  • 提案手法は、広告主が個々のユーザーに到達するために支払う金額を推定する際、82%を超える精度を達成した。
  • 暗号化された入札データを含めることで、平文価格のみに依存する手法と比較して、ユーザーあたり平均収益(ARPU)の推定値が約55%上昇した。
  • プローブキャンペーンのデータを用いたモデルの学習により、暗号化された入札価格を効果的に特定・測定でき、実世界の暗号化広告環境でも実現可能性を示した。
  • 12か月間にわたり1,600人の実際のユーザーを対象に検証された結果、多様なユーザー行動や広告交換所プラットフォームに対しても、モデルは強固で正確な性能を示した。
  • 従来の研究で暗号化された価格は測定不能であると仮定されていたが、本研究では外部インストルメンテーションを最小限に抑えても正確な推定が可能であることを証明した。
  • 結果から、平文データのみに依存するARPU推定値は、プログラム型広告におけるユーザー・データの真の市場価値を著しく低く評価している可能性があると示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。