[論文レビュー] Deciphering the 2016 U.S. Presidential Campaign in the Twitter Sphere: A Comparison of the Trumpists and Clintonists
本研究では、2016年米国大統領選挙キャンペーン期におけるドナルド・トランプおよびヒラリー・クリントンのTwitterフォロワーのデモグラフィック特性を、フォロワーのプロフィール、位置情報、フォロワー数、プロフィール画像を含むカスタムデータセット(US2016)を用いて分析している。フォロワー数をソーシャルインフルエンスの代理指標とし、プロフィール画像に畳み込みニューラルネットワーク(CNN)を適用することで、トランプ支持者はより社会的に極端な傾向にあり、年齢層も極端に広がっているのに対し、クリントン支持者は人種的により多様で、性別に偏りがないことが判明した。
In this paper, we study follower demographics of Donald Trump and Hillary Clinton, the two leading candidates in the 2016 U.S. presidential race. We build a unique dataset US2016, which includes the number of followers for each candidate from September 17, 2015 to December 22, 2015. US2016 also includes the geographical location of these followers, the number of their own followers and, very importantly, the profile image of each follower. We use individuals' number of followers and profile images to analyze four dimensions of follower demographics: social status, gender, race and age. Our study shows that in terms of social influence, the Trumpists are more polarized than the Clintonists: they tend to have either a lot of influence or little influence. We also find that compared with the Clintonists, the Trumpists are more likely to be either very young or very old. Our study finds no gender affinity effect for Clinton in the Twitter sphere, but we do find that the Clintonists are more racially diverse.
研究の動機と目的
- 2016年米国大統領選挙キャンペーン期におけるドナルド・トランプとヒラリー・クリントンのフォロワー間のデモグラフィック差を調査すること。
- 特に女性がヒラリー・クリントンをより多くフォローする傾向があるかどうか、性別に偏った関与(ジェンダー・アフィニティ効果)が存在するかを検証すること。
- 両候補のフォロワーにおける人種的多様性を評価し、人種グループ間の代表性を比較すること。
- 年齢分布のパターンを分析し、どちらの候補のフォロワーが特定の年齢層に集中しているかを特定すること。
- フォロワー数をオンラインステータスの代理指標として用い、ソーシャルインフルエンスの格差を評価すること。
提案手法
- 2015年9月17日から12月22日まで、両候補のフォロワーのデータを収集し、US2016データセットを構築した。収集内容にはフォロワー数、地理的位置、プロフィール画像が含まれる。
- OpenCVを用いてプロフィール画像から顔を検出し抽出した。高品質で顔が中央に位置し、25KB以上で、256×256ピクセルにリサイズされた画像を対象とした。
- MORPHデータベースを用いて畳み込みニューラルネットワーク(CNN)を訓練し、プロフィール画像から性別、人種(白人、黒人、ヒスパニック系)、年齢を分類した。アジア系の顔はサンプル数が少なかったため除外した。
- トランプ支持者とクリントン支持者の間のデモグラフィック割合の差の統計的有意性を評価するためにスコア検定統計量を用いた。
- フォロワー数をソーシャルインフルエンスの代理指標として扱い、両フォロワー集団におけるインフルエンス分布を分析した。
- ImageNetアーキテクチャのCaffe実装(ILSVRCで事前学習済み)を用い、性別、人種、年齢分類タスクに適用した。
実験結果
リサーチクエスチョン
- RQ1女性のTwitterユーザーは、ドナルド・トランプよりもヒラリー・クリントンをより多くフォローする傾向を示すか。これはジェンダー・アフィニティ効果を示唆するか?
- RQ2ヒラリー・クリントンのフォロワーは、ドナルド・トランプのフォロワーと比較して、人種的により多様であるか。特に黒人およびヒスパニック系の代表性が顕著に高いか?
- RQ3トランプ支持者とクリントン支持者の間で年齢分布に顕著な差があるか。トランプ支持者は非常に若年層または高年齢層に偏っているか?
- RQ4フォロワー数を用いたソーシャルインフルエンスの差は何か。特にトランプ支持者の間ではインフルエンスの分布がより極端に偏っているか?
- RQ5Twitterフォロワーのデモグラフィックパターンは、2016年米国大統領選挙におけるより広範な現実世界の投票傾向をどの程度反映しているか?
主な発見
- トランプ支持者は、ソーシャルインフルエンスの極端さが顕著に高い:非常に多くのフォロワーをもつ者も、非常に少ないフォロワー数の者も、クリントン支持者に比べてより顕著に存在する。クリントン支持者はインフルエンススケールの中央に均等に分布している。
- クリントン支持者はトランプ支持者よりも人種的により多様である:クリントン支持者のうち、黒人またはヒスパニック系である割合が顕著に高い。一方、トランプ支持者は白人である割合が高い。
- 統計的に有意なジェンダー・アフィニティ効果は認められない:クリントン支持者の女性フォロワーの割合は、トランプ支持者と比べて顕著に高くない。
- トランプ支持者は1〜17歳(選挙権がない年齢層)または40歳以上に多く、クリントン支持者は18〜40歳に集中している。スコア検定により、この差は統計的に有意であることが確認された。
- 年齢分布の分析から、クリントン支持者は1〜17歳および41〜66歳の年齢層に属する可能性が低く、18〜40歳の範囲に属する可能性が高い。これは若年層の有権者と世代的に一致していることを示している。
- 人種および年齢構成におけるすべてのデモグラフィック差は、統計的に有意であり、すべてのスコア検定のp値が0であった。これは、両者の割合に差がないという帰無仮説を強く支持する証拠である。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。