QUICK REVIEW

[論文レビュー] Analyzing Polarization in Social Media: Method and Application to Tweets on 21 Mass Shootings

Dorottya Demszky, Nikhil Garg|arXiv (Cornell University)|Apr 2, 2019

Social Media and Politics参考文献 53被引用数 46

ひとこと要約

本論文は、ソーシャルメディアにおける政治的分極化を4つの言語的次元（話題選択、フレーミング、感情、発語力）で分析する NLP フレームワークを提示し、21件の大量銃撃事件についての440万件ツイートに適用している。

ABSTRACT

We provide an NLP framework to uncover four linguistic dimensions of political polarization in social media: topic choice, framing, affect and illocutionary force. We quantify these aspects with existing lexical methods, and propose clustering of tweet embeddings as a means to identify salient topics for analysis across events; human evaluations show that our approach generates more cohesive topics than traditional LDA-based models. We apply our methods to study 4.4M tweets on 21 mass shootings. We provide evidence that the discussion of these events is highly polarized politically and that this polarization is primarily driven by partisan differences in framing rather than topic choice. We identify framing devices, such as grounding and the contrasting use of the terms "terrorist" and "crazy", that contribute to polarization. Results pertaining to topic choice, affect and illocutionary force suggest that Republicans focus more on the shooter and event-specific facts (news) while Democrats focus more on the victims and call for policy changes. Our work contributes to a deeper understanding of the way group divisions manifest in language and to computational methods for studying them.

研究の動機と目的

ソーシャルメディア上の言語が政治的分極化をどのように表現するかを理解する動機づけ。
複数の言語的次元（話題、フレーミング、感情、 illocutionary force）を横断して分極化を分析する包括的なフレームワークを開発する。
Twitter データを用いて、大量銃撃イベント内およびイベント間で分極化とその進展を定量化する。
分極化された談話におけるフレーミングと話題選択の相互作用における shooterRace の影響を特定する。
再現性とさらなる研究のためのデータセットと方法を提供する。

提案手法

各イベントごとに語彙集とトークンベースの特徴を定義し、language polarization を測る Leave-out 部分的偏りを計算する。
埋め込みベースのツイートクラスタリング手法を開発し、一貫性のあるイベント非依存の話題を誘導し、MALLET および Biterm Topic Model (BTM) と比較する。
Arora et al. (2017) の文ベクトルを GloVe ベースのトークン表現に適用して、コサイン距離を用いて k-means でツイートをクラスタリングする。
話題ラベル付けデータに対して Leave-out 推定量を用いて、話題内外の partisanship を計算する。
分極化を話題レベルと話題内成分に分解し、分極化が話題選択によるものか、話題内のフレーミングによるものかを評価する。
発言者の人種がフレーミングと話題の嗜好に与える影響を、 partisan ログオッズ比と文脈 grounding を用いて分析する。

実験結果

リサーチクエスチョン

RQ1大統領ラインに沿ったツイッター上の大規模銃撃事件に関する議論はどれくらい分極化しているのか？
RQ2話題選択と話題内のフレーミングのどちらが分極化を生み出しているのか？
RQ3 shooter の人種はフレーミング、話題の嗜好、感情表現にどのような影響を与えるのか？
RQ4この領域を特徴づける具体的なフレーミング手法と illocutionary force（発語力）とは何か？
RQ5感情表現とモダリティ（illocutionary force）は、これらのイベントにおける partisan 分極化に寄与するのか？

主な発見

大量銃撃事件に関するツイートは高度に分極化しており、Leave-out 部分的偏りの値はイベント間でおおよそ 0.517 〜 0.547 の範囲で推移する。
話題内分極化は時間とともに増加する一方、話題間分極化は安定している。
共和党は shooter のアイデンティティとニュースにより焦点を当て、民主党は被害者と政策変更に焦点を当てる傾向がある。
フレーミング手法としての grounding や「terrorist」や「crazy」といった語の差別的使用は shooter の人種に依存し、民主党は白人 shooter をテロリストと呼ぶ傾向があり、共和党は非白人 shooter を異なるパターンで同様にラベル付けしやすい。
感情分析では、黒人系の shooter の場合に民主党がより肯定的な感情、悲しみ、信頼を表現する一方で、共和党はより恐怖と嫌悪を表現する傾向が強い。
モーダル（should, must, have to, need to）は行動を喚起するために主に用いられ、民主党が多くの話題でそれらを用いる傾向がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。