[논문 리뷰] Deciphering the 2016 U.S. Presidential Campaign in the Twitter Sphere: A Comparison of the Trumpists and Clintonists
이 연구는 2016년 미국 대선 캠프 기간 동안 도널드 트럼프와 힐러리 클린턴의 트위터 팔로워 인구통계를 분석한다. 고유의 데이터셋(US2016)을 활용하여 팔로워 프로필, 위치, 팔로워 수, 프로필 이미지를 포함한다. 팔로워 수를 사회적 영향력의 대체 지표로 사용하고, 프로필 이미지에 대해 합성곱 신경망(CNN)을 적용한 결과, 트럼프 지지자들은 더 사회적으로 극단화되어 있으며 연령대가 더 극단적인 편이며, 클린턴 지지자들은 더 다양한 인종 배경을 지닌 것으로 나타났다. 또한 성별에 대한 특별한 기대 효과는 관찰되지 않았다.
In this paper, we study follower demographics of Donald Trump and Hillary Clinton, the two leading candidates in the 2016 U.S. presidential race. We build a unique dataset US2016, which includes the number of followers for each candidate from September 17, 2015 to December 22, 2015. US2016 also includes the geographical location of these followers, the number of their own followers and, very importantly, the profile image of each follower. We use individuals' number of followers and profile images to analyze four dimensions of follower demographics: social status, gender, race and age. Our study shows that in terms of social influence, the Trumpists are more polarized than the Clintonists: they tend to have either a lot of influence or little influence. We also find that compared with the Clintonists, the Trumpists are more likely to be either very young or very old. Our study finds no gender affinity effect for Clinton in the Twitter sphere, but we do find that the Clintonists are more racially diverse.
연구 동기 및 목표
- 2016년 미국 대선 캠프 기간 동안 도널드 트럼프와 힐러리 클린턴의 팔로워 간 인구통계적 차이를 조사하기 위해.
- 특히 여성들이 힐러리 클린턴을 더 많이 팔로우하는지 여부를 고려해 트위터에서 성별 기대 효과가 존재하는지 검토하기 위해.
- 두 후보자의 팔로워들 간 인종 다양성을 평가하고, 인종 집단 간 대표성을 비교하기 위해.
- 연령 분포 패턴을 분석하고, 한 후보의 팔로워가 특정 연령대에 더 집중되어 있는지 여부를 확인하기 위해.
- 팔로워 수를 온라인 지위의 대체 지표로 사용해 사회적 영향력 격차를 평가하기 위해.
제안 방법
- 2015년 9월 17일부터 12월 22일까지의 기간 동안, 팔로워 수, 지리적 위치, 프로필 이미지를 포함한 US2016 데이터셋을 구축하였다.
- OpenCV를 사용해 프로필 사진에서 얼굴 이미지를 탐지하고 추출하였으며, 고해상도, 얼굴 중심, 25KB 이상의 크기이며 256×256 픽셀로 리사이징된 이미지만 필터링하였다.
- MORPH 데이터베이스를 기반으로 합성곱 신경망(CNN)을 훈련시어 성별, 인종(백인, 히스패닉, 흑인) 및 연령을 프로필 이미지에서 분류하였으며, 샘플 수가 적어 아시아인 얼굴은 제외하였다.
- 트럼프 지지자와 클린턴 지지자 간 인구통계 비율의 차이가 통계적으로 유의미한지 평가하기 위해 점수 검정 통계량을 사용하였다.
- 팔로워 수를 사회적 영향력의 대체 지표로 간주하여, 두 팔로워 집단 간 영향력 분포를 분석하였다.
- ImageNet 아키텍처의 Caffe 구현체를 사용하여 ILSVRC에서 사전 훈련된 모델을 성별, 인종 및 연령 분류 작업에 적용하였다.
실험 결과
연구 질문
- RQ1여성 트위터 사용자들이 힐러리 클린턴을 도널드 트럼프보다 더 선호하는가? 이는 성별 기대 효과를 시사하는가?
- RQ2힐러리 클린턴의 팔로워는 도널드 트럼프의 팔로워보다 더 높은 인종 다양성을 보이는가? 특히 흑인과 히스패닉 인구의 대표성이 더 높은가?
- RQ3트럼프 지지자와 클린턴 지지자 간의 연령 분포에 유의미한 차이가 있는가? 트럼프 지지자들이 매우 어린이 또는 매우 노인일 가능성이 더 높은가?
- RQ4팔로워 수를 통해 측정한 사회적 영향력은 두 팔로워 집단 간에 어떻게 다를까? 트럼프 지지자들 사이에서 영향력 분포가 더 극단화되어 있는가?
- RQ5트위터 팔로워의 인구통계 패턴은 2016년 미국 대선에서의 실질적인 투표 경향을 얼마나 반영하고 있는가?
주요 결과
- 트럼프 지지자들은 사회적 영향력의 극단화가 뚜렷하다: 매우 많은 팔로워를 가진 이들 또는 매우 적은 팔로워를 가진 이들이 더 많으며, 클린턴 지지자들은 영향력 스펙트럼의 중앙에 더 균형 있게 분포되어 있다.
- 클린턴 지지자들은 트럼프 지지자들보다 더 높은 인종 다양성을 보인다: 클린턴 지지자들 중 흑인이나 히스패닉 인종의 비율이 유의미하게 높으며, 트럼프 지지자들은 백인 비율이 더 높다.
- 통계적으로 유의미한 성별 기대 효과는 관찰되지 않았다: 클린턴 지지자들 중 여성 비율이 트럼프 지지자들보다 높지 않다.
- 트럼프 지지자들은 1-17세 연령대(유권자 자격이 없는 연령대) 또는 40세 이상일 가능성이 더 높으며, 클린턴 지지자들은 18-40세 연령대에 더 집중되어 있다. 점수 검정을 통해 이 차이가 통계적으로 유의미하다고 확인되었다.
- 연령 분포 분석 결과, 클린턴 지지자들은 1-17세 및 41-66세 연령대에 속할 가능성이 낮고, 18-40세 범위에 더 많이 속해 있어 젊은 유권자들과의 세대적 일치를 보이고 있다.
- 모든 인종 및 연령 구성의 인구통계적 차이가 통계적으로 유의미하였으며, 모든 점수 검정의 p-값은 0이었고, 등비 비율이 동일하다는 귀무가설에 대한 강력한 반박 근거가 있었다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.