Skip to main content
QUICK REVIEW

[論文レビュー] Who Makes Trends? Understanding Demographic Biases in Crowdsourced Recommendations

Abhijnan Chakraborty, Johnnatan Messias|arXiv (Cornell University)|Apr 1, 2017
Social Media and Politics被引用数 39
ひとこと要約

本稿は、Twitterにおけるクラウドソーシングによるトレンドトピック推薦における人種的・性別的・年齢的バイアスを、トレンドになる前にトピックを拡散するユーザーの性別・人種・年齢を分析することで調査している。米国のトレンド約5,000件をカバーする3か月間のデータセットを用い、トレンドを促すユーザーは、とりわけ中年ブラック・ウィメンを含むマイノリティグループにおいて顕著に代表されていないことが判明。トレンドが拡散するに従い、その代表性は高まるが、これはソーシャルメディア推薦システムにおける構造的入力バイアスを示している。

ABSTRACT

Users of social media sites like Facebook and Twitter rely on crowdsourced content recommendation systems (e.g., Trending Topics) to retrieve important and useful information. Contents selected for recommendation indirectly give the initial users who promoted (by liking or posting) the content an opportunity to propagate their messages to a wider audience. Hence, it is important to understand the demographics of people who make a content worthy of recommendation, and explore whether they are representative of the media site's overall population. In this work, using extensive data collected from Twitter, we make the first attempt to quantify and explore the demographic biases in the crowdsourced recommendations. Our analysis, focusing on the selection of trending topics, finds that a large fraction of trends are promoted by crowds whose demographics are significantly different from the overall Twitter population. More worryingly, we find that certain demographic groups are systematically under-represented among the promoters of the trending topics. To make the demographic biases in Twitter trends more transparent, we developed and deployed a Web-based service 'Who-Makes-Trends' at twitter-app.mpi-sws.org/who-makes-trends.

研究の動機と目的

  • Twitterでトレンドトピックを拡散するユーザーのデモグラフィック構成が、全体のユーザー人口を反映しているかどうかを調査すること。
  • 特に女性、ブラック・ユーザー、中年層において、系統的な低代表性がトレンドプロモーターに見られるかどうかを特定すること。
  • トピックプロモーターのデモグラフィック特性が、ソーシャルメディアトレンドの可視性および到達範囲にどのように影響するかを理解すること。
  • 公開用のWebツール「Who-Makes-Trends」を開発・配備し、一般および研究用途向けにトレンドプロモーターのデモグラフィック構成を可視化すること。
  • アルゴリズムそのものだけでなく、入力側のクラウド(プロモーター集団)に存在するバイアスに焦点を当て、アルゴリズム的推薦の透明性を高めることを提唱すること。

提案手法

  • 米国におけるTwitterのトレンド約5,000件をカバーする3か月間(2016年7月〜9月)のデータセットを収集し、関連するツイートおよびユーザーのメタデータを含めた。
  • トレンドになる前後、トレンドに参加した数百万のユーザーに対して、性別・人種・年齢のデモグラフィック属性を推定した。
  • 統計的発散測度を用いて、トレンド前のプロモーターのデモグラフィック分布を米国全体のTwitterユーザー人口と比較した。
  • トレンドになる前と後のトピック投稿者におけるデモグラフィック代表性の変化を追跡し、影響力の変化を評価した。
  • 任意の米国トレンドについて、プロモーターのデモグラフィック構成を可視化するための公開Webサービス「Who-Makes-Trends」(twitter-app.mpi-sws.org/who-makes-trends)を開発・配備した。
  • 2016年米国大統領選挙期における選挙関連トレンドを分析し、異なるデモグラフィックグループがどのように自身の視点を反映するトピックを拡散したかを観察した。

実験結果

リサーチクエスチョン

  • RQ1Twitterでトレンドトピックを拡散するユーザーのデモグラフィック特性は、米国のTwitterユーザー全体のデモグラフィック構成とどのように異なるか?
  • RQ2トレンドプロモーターにおいて、系統的に低代表性が見られるデモグラフィックグループはどれであり、その低代表性はどれほど顕著か?
  • RQ3トピックがトレンドになる前段階からトレンド後段階にかけて、投稿者のデモグラフィックプロファイルはどのように変化するか?
  • RQ4特定のデモグラフィックグループによって主に拡散されるトピックは、ニッチな関心を反映しているのか、それとも多様な視点を持つ社会的出来事の反映なのか、その程度は?
  • RQ5トレンドプロモーターのデモグラフィック構成を公開する透明性のあるシステムは、ソーシャルメディア推薦システムにおけるバイアスの認識を高めることができるか?

主な発見

  • Twitterのトレンドトピックの大部分は、米国全体のTwitterユーザー人口とは顕著に異なるデモグラフィック構成を持つユーザーによって拡散されている。
  • 中年ブラック・ウィメンは、トレンドプロモーターにおいて最も低代表的である。一般ユーザー層に比べて顕著に低い割合で登場する。
  • トレンドになる前のトピック拡散者たちは全体のユーザー人口と著しく乖離しているが、トレンド化後に投稿するユーザーのデモグラフィック構成は、全体のTwitterユーザー人口に近づく。
  • 特定のデモグラフィックグループによって主に拡散されるトピックは、ニッチな関心を反映することが多いが、2016年米国大統領選挙のような主要な社会的出来事では、多様なグループが異なる視点を提供する。
  • 2016年米国大統領選挙の分析から、異なるデモグラフィックグループが異なるトレンドを拡散していることが判明した。例えば、中年白人男性は「#PresidentTrump」を拡散したが、若年および中年のブラック・アジア系男性は「#NowThatTrumpIsPresident」を拡散した。
  • 本研究は、アルゴリズムや出力に注目するのではなく、トレンドを促す入力側のクラウド(特にプロモーター)が、推薦パイプラインに顕著なデモグラフィックバイアスをもたらしていることを示している。このバイアスは、しばしば無視されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。