Skip to main content
QUICK REVIEW

[論文レビュー] Adscape: Harvesting and Analyzing Online Display Ads

Paul Barford, Igor Canadi|arXiv (Cornell University)|Jul 3, 2014
Web Data Mining and Analysis参考文献 10被引用数 45
ひとこと要約

本稿では、340の異なるユーザープロファイルを用いて180の英語圏のWebサイトから175,000件を超える一意なオンラインディスプレイ広告を収集する、新しいプロファイルベースのWebクローリングシステム「Adscape」を提案する。研究では、趣味ベースおよび人口統計的(年齢/性別)ターゲティングの広範な使用が明らかとなり、広告がユーザープロファイルごとに顕著に異なることが判明。また、多様な業界分野にまたがる3,700件を超える一意な広告主が同定された。

ABSTRACT

Over the past decade, advertising has emerged as the primary source of revenue for many web sites and apps. In this paper we report a first-of-its-kind study that seeks to broadly understand the features, mechanisms and dynamics of display advertising on the web - i.e., the Adscape. Our study takes the perspective of users who are the targets of display ads shown on web sites. We develop a scalable crawling capability that enables us to gather the details of display ads including creatives and landing pages. Our crawling strategy is focused on maximizing the number of unique ads harvested. Of critical importance to our study is the recognition that a user's profile (i.e. browser profile and cookies) can have a significant impact on which ads are shown. We deploy our crawler over a variety of websites and profiles and this yields over 175K distinct display ads. We find that while targeting is widely used, there remain many instances in which delivered ads do not depend on user profile; further, ads vary more over user profiles than over websites. We also assess the population of advertisers seen and identify over 3.7K distinct entities from a variety of business segments. Finally, we find that when targeting is used, the specific types of ads delivered generally correspond with the details of user profiles, and also on users' patterns of visit.

研究の動機と目的

  • サイト負荷を最小限に抑えつつ、ユーザーフレンドリーな広告配信行動を保持する、スケーラブルなプロファイルベースのWebクローリングインfraを構築すること。
  • 広告配信の広範な状況(以下、「Adscape」と呼ぶ)を特徴づけること。広告の多様性、ターゲティングメカニズム、広告主の集団を含む。
  • ユーザープロファイル(例:ブラウザ、Cookie)が広告配信に与える影響を実証的に調査し、広告のパーソナライゼーションの度合いと、複数のWebサイトにわたる一貫性を評価すること。
  • 配信された広告が、趣味、年齢、性別などのユーザープロファイル特性とどの程度整合しているかを分析し、ターゲティングの有効性を理解すること。
  • 大規模な実証的データ収集を通じて、広告ターゲティングシステムの改善と広告配信エコシステムの最適化に基盤的知見を提供すること。

提案手法

  • 個々のユーザを模倣するための異なるブラウザプロファイルとCookieを備えたFirefoxブラウザを用いた、プロファイルベースのクローリングフレームワークを構築。これにより、現実的な広告配信シナリオのシミュレーションが可能となった。
  • 画像の配置、サイズ、文脈を分析することで、ページ要素からディスプレイ広告を識別するカスタム広告検出モジュールを実装。クリエイティブおよびランディングページの正確な収集を保証した。
  • 180の主要な英語圏のWebサイトにクローラーを展開。広告の多様性と一意性を最大化するため、340の異なるユーザープロファイルを用いた。
  • 広告クリエイティブ、ランディングページ、広告主の識別子、ターゲティング信号(例:趣味カテゴリー、人口統計的ターゲティング)のデータを収集・構造化し、分析に供した。
  • クラスタリングおよび分類手法を適用し、広告の内容、広告主、ターゲティング基準ごとに広告をグループ化。広告の類似性およびターゲティングパターンの分析を可能にした。
  • 縦断的クローリング戦略を用いて、広告の新鮮さとキャンペーンのダイナミクスを評価。広告配信の最新の実態を反映するデータを確保した。

実験結果

リサーチクエスチョン

  • RQ1Webサイトはどの程度広告ターゲティングメカニズムを採用しているのか。また、異なるユーザープロファイル間でターゲティングはどのように異なるのか。
  • RQ2オンラインディスプレイ広告エコシステムにおける広告主の集団はどれほど多様で、どの業界分野が最も代表的か。
  • RQ3配信された広告は、趣味、年齢、性別といったユーザープロファイル特性とどの程度整合しているか。
  • RQ4広告の差異は、Webサイト間の違いとユーザープロファイル間の違いのどちらに起因しているのか。また、どちらの要因が広告配信により強い影響を与えているか。
  • RQ5Web全体にわたるディスプレイ広告の全体的な多様性と一意性はどの程度か。また、ユーザーフレンドリーな文脈に応じてどのように変化するか。

主な発見

  • 調査対象のWebサイトにおけるディスプレイ広告インVENTORYの80%以上がターゲティングメカニズムを採用しており、パーソナライズド広告配信の広範な採用が示された。
  • 本システムは175,000件を超える一意なディスプレイ広告を収集した。広告の内容とターゲティングが異なるユーザープロファイルごとに顕著に異なることから、強いパーソナライゼーション効果が示された。
  • ショッピング、金融サービス、コンピュータ販売など、多様な業界分野にまたがる3,700件を超える一意な広告主が同定され、広範かつ活発な広告エコシステムが存在することが示された。
  • 趣味ベースのターゲティングは広く採用されており、広告は一般的にユーザープロファイル特性(趣味、年齢、性別)と整合していることが確認され、行動ターゲティングの有効性が裏付けられた。
  • 広告の差異は、ユーザープロファイル間の違いの方が、Webサイト間の違いよりも顕著に大きい。これは、ユーザーレベルのプロファイリングが、サイトレベルのコンテンツよりも広告配信に強い影響を与えていることを示している。
  • 広範なターゲティングが採用されているにもかかわらず、多くの広告がプロファイルにかかわらずすべてのユーザーに一様に配信されている。これは、ターゲティングの実装に限界や一貫性の欠如がある可能性を示唆している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。