QUICK REVIEW

[논문 리뷰] Analyzing Polarization in Social Media: Method and Application to Tweets on 21 Mass Shootings

Dorottya Demszky, Nikhil Garg|arXiv (Cornell University)|2019. 04. 02.

Social Media and Politics참고 문헌 53인용 수 46

한 줄 요약

이 논문은 소셜 미디어에서의 정치적 분극을 다루는 네 가지 언어 차원(주제 선택, 프레이밍, 정서, 발화력)을 분석하는 NLP 프레임워크를 제시하며, 210만 건의 mass shootings 트윗 4.4백만 트윗에 적용합니다.

ABSTRACT

We provide an NLP framework to uncover four linguistic dimensions of political polarization in social media: topic choice, framing, affect and illocutionary force. We quantify these aspects with existing lexical methods, and propose clustering of tweet embeddings as a means to identify salient topics for analysis across events; human evaluations show that our approach generates more cohesive topics than traditional LDA-based models. We apply our methods to study 4.4M tweets on 21 mass shootings. We provide evidence that the discussion of these events is highly polarized politically and that this polarization is primarily driven by partisan differences in framing rather than topic choice. We identify framing devices, such as grounding and the contrasting use of the terms "terrorist" and "crazy", that contribute to polarization. Results pertaining to topic choice, affect and illocutionary force suggest that Republicans focus more on the shooter and event-specific facts (news) while Democrats focus more on the victims and call for policy changes. Our work contributes to a deeper understanding of the way group divisions manifest in language and to computational methods for studying them.

연구 동기 및 목표

소셜 미디어에서의 언어가 정치적 분극을 어떻게 표현하는지 이해를 촉진한다.
다양한 언어 차원(주제, 프레이밍, 정서, 발화력)을 통해 분극을 분석하는 포괄적 프레임워크를 개발한다.
트위터 데이터를 활용해 대 mass shooting 사건들 간 및 내부에서의 분극과 그 진화를 정량화한다.
발화자 인종이 프레이밍 및 주제 선택과 어떻게 상호작용하는지 분석하여 분극 담론에서의 상호작용을 규명한다.
복제 및 추가 연구를 가능하게 하는 데이터셋과 방법을 제공한다.

제안 방법

각 사건별 어휘 집합과 토큰 기반 특징을 정의하고 leave-out partisanship를 계산하여 언어 분극성을 측정한다.
임베딩 기반 트윗 클러스터링 접근법을 개발하여 응집력 있는, 사건에 독립적인 주제를 유도하고 MALLET 및 Biterm Topic Model (BTM)과 비교한다.
Arora et al. (2017) 문장 임베딩을 GloVe 기반 토큰 표현에 적용하여 k-means(코사인 거리)로 트윗을 클러스터링한다.
토픽 된 데이터에 대해 leave-out 추정치를 사용하여 주제 내외의 분극성을 계산한다.
주제 수준 및 주제 내 구성요소로 분극성을 분해하여 분극성이 주제 선택으로부터인가, 주제 내 프레이밍으로부터 기인하는지 평가한다.
발화자 인종이 프레이밍과 주제 선호도에 미치는 영향을 partisan log odds ratio와 context grounding을 사용하여 분석한다.

실험 결과

연구 질문

RQ1트윗에서 mass shootings에 대한 논의가 당파적 견해에 따라 얼마나 분극되어 있는가?
RQ2주제 선택으로부터의 분극성과 주제 내 프레이밍으로부터의 분극성 중 어느 쪽이 더 큰가?
RQ3발화자의 인종이 프레이밍, 주제 선호도, 정서 표현에 어떤 영향을 미치는가?
RQ4이 영역의 당파적 담론을 특징짓는 구체적 프레이밍 장치와 발화력은 무엇인가?
RQ5정서 및 양식(발화력)이 이러한 사건에서 당파적 분극에 기여하는가?

주요 결과

mass shootings에 대한 트윗은 높은 수준의 분극성을 보이며, leave-out partisanship 값은 사건별로 대략 0.517에서 0.547 사이에서 변동한다.
주제 내 분극성은 시간이 지남에 따라 증가하는 반면, 주제 간 분극성은 안정적이다.
공화당은 발화자 정체성과 뉴스에 더 집중하는 반면, 민주당은 희생자 및 정책 변화에 더 집중한다.
-grounding과 예: ‘terrorist’와 ‘crazy’와 같은 용어의 차별적 사용 및 프레이밍 장치는 발화자 인종에 따라 달라지며, 민주당은 백인 발화자를 테러리스트로 표기하는 경향이 더 많고, 공화당은 비백인 발화자를 유사하게 표기하는 경향이 다른 패턴으로 나타난다.
정서 분석에서 민주당은 더 긍정적 정서, 슬픔, 신뢰를 표현하는 반면, 공화당은 공포와 혐오를 더 많이 표현하고, 특히 발화자가 유색인 경우 그렇다.
모달 표현(should, must, have to, need to)은 주로 행동 촉구를 위해 사용되며, 민주당이 주제 전반에 걸쳐 이를 사용할 가능성이 더 높다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.