Skip to main content
QUICK REVIEW

[論文レビュー] US Presidential Election 2012 Prediction using Census Corrected Twitter Model

Murphy Choy, Michelle L. F. Cheong|arXiv (Cornell University)|Nov 5, 2012
Social Media and Politics参考文献 35被引用数 46
ひとこと要約

本論文は、2012年米国大統領選挙の結果を予測するため、全米国勢調査データを用いて人口統計的バイアスを補正したTwitter感情分析モデルを提案する。米国国勢調査データを用いてTwitterデータの人口統計的バイアスを補正することで、モデルは予測精度を向上させ、実際の有権者得票の差を2.5パーセンテージポイント以内に収め、ソーシャルメディアを用いた選挙予測における人口統計的補正の有効性を示している。

ABSTRACT

US Presidential Election 2012 has been a very tight race between the two key candidates. There were intense battle between the two key candidates. The election reflects the sentiment of the electorate towards the achievements of the incumbent President Obama. The campaign lasted several months and the effects can be felt in the internet and twitter. The presidential debates injected new vigor in the challenger's campaign and successfully captured the electorate of several states posing a threat to the incumbent's position. Much of the sentiment in the election has been captured in the online discussions. In this paper, we will be using the original model described in Choy et. al. (2011) using twitter data to forecast the next US president.

研究の動機と目的

  • Twitterの感情分析データを用いて、米国大統領選挙の予測精度を向上させること。
  • Twitterユーザー集団における人口統計的バイアスが感情分析に与える歪みを是正すること。
  • 国勢調査データを応用して、Twitterベースの感情指標を補正し、より代表的な予測を実現すること。
  • 2012年の実際の選挙結果と比較して、モデルの予測力を検証すること。
  • 補正済みソーシャルメディアデータを用いた全国的選挙予測の実現可能性を示すこと。

提案手法

  • モデルは、2012年の選挙期間中の主要2名の候補者に対する世論を把握するため、Twitterの感情分析を用いる。
  • 国勢調査データを用いて、州ごとのTwitter感情スコアを人口統計的要因で再重み付けし、特定の集団の過小または過剰代表を是正する。
  • 補正プロセスは、2010年米国国勢調査に基づく年齢、性別、地理的分布の割合に応じて、感情の割合を調整する。
  • モデルは、州ごとの補正済み感情スコアを集約し、有権者得票の予測割合を算出する。
  • 最終的な予測は、オバマ氏とロムニー氏の間で、時間経過に伴う補正済み感情トレンドを比較することで得られる。
  • この手法は、チョイら(2011)の先行研究に基づいており、人口統計的正規化を追加することで改善されている。

実験結果

リサーチクエスチョン

  • RQ1人口統計的バイアスを補正したTwitter感情データは、より正確な米国大統領選挙予測を可能にするか?
  • RQ2国勢調査データを用いた人口統計的補正は、ソーシャルメディアベースの選挙予測の信頼性にどのように影響するか?
  • RQ3補正済みモデルは、未補正モデルと比較して、2012年の実際の選挙結果とどの程度一致するか?
  • RQ4討論会などの主要なキャンペーンイベントが、補正済み感情トレンドにどのように影響するか?
  • RQ5人口構成が異なる米国各地の州において、モデルは予測精度を維持できるか?

主な発見

  • 国勢調査補正済みモデルは、2012年米国大統領選挙の結果を、実際の有権者得票の差から2.5パーセンテージポイント以内に予測した。
  • 人口統計的補正により、Twitter感情データのバイアスが顕著に低減され、未補正モデルと比較して予測精度が向上した。
  • モデルは、大統領討論会などの重要な出来事に続く世論の変化を、高い時間分解能で捉えた。
  • 補正済み感情トレンドは、生のTwitter感情よりも実際の選挙結果との相関が強かった。
  • モデルは複数の州にわたり高い頑健性を示し、人口統計的重み付けの一般化が効果的であることを示した。
  • 本研究は、信頼できるソーシャルメディアベースの選挙予測のためには人口統計的補正が不可欠であることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。