Skip to main content
QUICK REVIEW

[論文レビュー] Tracing Information Flows Between Ad Exchanges Using Retargeted Ads

Muhammad Ahmad Bashir, Sajjad Arshad|arXiv (Cornell University)|Nov 2, 2018
Privacy, Security, and Data Protection参考文献 40被引用数 25
ひとこと要約

本稿では、リターゲティング広告をプローブとして用いることで、広告交換間のクライアントおよびサーバーサイドの情報フローを検出する、新たな意味論的駆動型手法を提案する。本手法は、従来のヒューリスティックベースの手法が見逃していた、以前に未発見だった4つのデータ共有タイプを同定し、リターゲティングのためのグーグルのクロスサービスデータ共有に関する実証的証拠を提供する。

ABSTRACT

Numerous surveys have shown that Web users are concerned about the loss of privacy associated with online tracking. Alarmingly, these surveys also reveal that people are also unaware of the amount of data sharing that occurs between ad exchanges, and thus underestimate the privacy risks associated with online tracking. In reality, the modern ad ecosystem is fueled by a flow of user data between trackers and ad exchanges. Although recent work has shown that ad exchanges routinely perform cookie matching with other exchanges, these studies are based on brittle heuristics that cannot detect all forms of information sharing, especially under adversarial conditions. In this study, we develop a methodology that is able to detect client- and server-side flows of information between arbitrary ad exchanges. Our key insight is to leverage retargeted ads as a tool for identifying information flows. Intuitively, our methodology works because it relies on the semantics of how exchanges serve ads, rather than focusing on specific cookie matching mechanisms. Using crawled data on 35,448 ad impressions, we show that our methodology can successfully categorize four different kinds of information sharing behavior between ad exchanges, including cases where existing heuristic methods fail. We conclude with a discussion of how our findings and methodologies can be leveraged to give users more control over what kind of ads they see and how their information is shared between ad exchanges.

研究の動機と目的

  • 広告交換間の包括的な情報フローを特定するためのツールの不足に取り組むこと、特にオフスカレーションやサーバーサイドメカニズムの下での状況を想定する。
  • オフスカレーション(例:暗号化ハッシュ化)が用いられる場合に、クッキー照合を検出できない既存のヒューリスティックベースの手法の限界を克服すること。
  • コンテンツおよび交換に依存しない手法を開発し、リターゲティング広告の行動的意味論を活用して情報フローを推定すること。
  • 主な広告交換(例:グーグル、クリテオ、SSP、DSP)がRTBエコシステム内で果たす役割とデータ共有行動を実証的に特徴付けること。
  • プライバシー保護型広告ブロッキングや情報フロー制御システムのための真のデータを提供することで、ユーザーのプライバシー制御をより的確に可能にすること。

提案手法

  • ユーザーが以前に閲覧した商品の広告を再表示するリターゲティング広告を、広告交換間の情報フローを推定するためのプローブとして使用する。
  • 5,102個の異なるリターゲティング広告から、スクリプト、iframe、リクエストを含む完全なリソースインクルージョンチェーンを記録する、Chromiumベースのクローラーを構築する。
  • インクルージョンチェーンにパターンマッチングルールを適用し、各リターゲティング広告の配信に関与する広告交換の順序を同定する。
  • 検出されたフローを4つのタイプに分類する:クッキー照合、直接データ共有、共有トラッキングインfra、サーバーサイド連携。
  • 推定された交換相互作用ネットワークに対してグラフ解析を実施し、役割(例:DSP、SSP)やデータフローのパターンを推定する。
  • 得られたデータセットを真のデータとして活用し、将来のプライバシー保護型システム(例:IFCベースのブロッカー、ルールベースの広告ブロッカー)の設計を支援する。

実験結果

リサーチクエスチョン

  • RQ1リターゲティング広告は、広告交換間のクライアントおよびサーバーサイドの情報フローを検出するための信頼できるプローブとして利用可能か?
  • RQ2既存のヒューリスティックベースの手法は、クッキー照合フローをどの程度効果的に検出できるか?また、その中で何パーセントのフローが見逃されているか?
  • RQ3主な広告交換(例:グーグル、クリテオ、SSP)がリターゲティングパイプラインにおいて果たす実際の役割とデータ共有行動は何か?
  • RQ4グーグルは、リターゲティングのためのクロスサービスデータ共有を実現するために、自社の第一者インフラをどの程度活用しているか?
  • RQ5検出された情報フローは、より効果的でプライバシー保護型の広告ブロッキングや情報フロー制御システムの構築に利用可能か?

主な発見

  • 提案手法は、過去のヒューリスティックベースの手法がオフスカレーション(例:暗号化ハッシュ化)を用いる場合にフローを同定できないのに対し、31%多くの広告交換ペア間のデータ共有を検出できる。
  • 実証的証拠により、グーグルがリターゲティングのためのユーザー情報を共有するために、自社の内部インフラ(例:googletagservices、doubleclick)を活用していることが確認され、プライバシーポリシーの主張が裏付けられた。
  • クリテオはグーグルシンジケーションに次いでリターゲティング広告の第二の主要な供給元であり、2014年時点で米国および英国で最大のリターゲターである。
  • SSP(供給サイドプラットフォーム)はDSPよりも高いインデグリーレートを示しており、広告交換ネットワークにおける中枢的なハブとしての役割を果たしていることが示され、一部はSSPおよびDSPの両方の機能を有している。
  • グーグルのドメイン(例:doubleclick、googlesyndication)は、SSPおよびDSPの二重の役割を果たしており、しばしばオークションに参加し、リターゲティング広告の配信に勝利する。
  • グラフ解析により、広告交換はそのネットワーク内での位置と接続性に基づき、自動的にDSP、SSP、ハイブリッドプラットフォームなどの役割に分類可能であることが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。