Skip to main content
QUICK REVIEW

[논문 리뷰] US Presidential Election 2012 Prediction using Census Corrected Twitter Model

Murphy Choy, Michelle L. F. Cheong|arXiv (Cornell University)|2012. 11. 05.
Social Media and Politics참고 문헌 35인용 수 46
한 줄 요약

이 논문은 2012년 미국 대선 결과를 예측하기 위해 캐논스 보정 Twitter 감성 분석 모델을 제안한다. 미국 캐논스 자료를 활용해 인구 통계적 편향을 보정함으로써 Twitter 데이터를 보정함으로써 예측 정확도를 향상시켰으며, 실제 인기 득표와 2.5%p 이내로 예측하여 사회적 미디어 기반 대선 예측에서 인구 통계적 보정의 효과성을 입증한다.

ABSTRACT

US Presidential Election 2012 has been a very tight race between the two key candidates. There were intense battle between the two key candidates. The election reflects the sentiment of the electorate towards the achievements of the incumbent President Obama. The campaign lasted several months and the effects can be felt in the internet and twitter. The presidential debates injected new vigor in the challenger's campaign and successfully captured the electorate of several states posing a threat to the incumbent's position. Much of the sentiment in the election has been captured in the online discussions. In this paper, we will be using the original model described in Choy et. al. (2011) using twitter data to forecast the next US president.

연구 동기 및 목표

  • Twitter 감성 데이터를 활용해 미국 대선 예측 정확도를 향상시키기 위해.
  • Twitter 사용자 인구 통계적 편향이 감성 분석에 영향을 미치는 문제를 다루기 위해.
  • 캐논스 자료를 적용해 Twitter 기반 감성 지표를 보정하여 더 대표적인 예측을 가능하게 하기 위해.
  • 모델의 예측 능력을 실제 2012년 대선 결과와 비교하여 검증하기 위해.
  • 보정된 사회적 미디어 데이터를 활용한 국가 수준의 대선 예측의 가능성을 입증하기 위해.

제안 방법

  • 모델은 2012년 대선 기간 동안 두 주요 후보자에 대한 대중의 여론을 측정하기 위해 Twitter 감성 분석을 사용한다.
  • 모델은 캐논스 자료를 활용해 각 주별로 Twitter 감성 점수를 재가중하여 인구 통계적 그룹의 부족 또는 과잉 표현을 보정한다.
  • 보정 과정은 2010년 미국 캐논스 자료에서 확보한 연령, 성별, 지리적 분포 기반으로 감성 비율을 조정한다.
  • 모델은 주별로 보정된 감성 점수를 집계하여 인기 득표 비율을 추정한다.
  • 최종 예측은 오바마와 레이먼드 간의 보정된 감성 추세를 시간에 따라 비교함으로써 도출된다.
  • 이 방법은 채 등(2011)의 이전 모델을 기반으로 하되, 인구 통계적 정규화를 통해 향상시켰다.

실험 결과

연구 질문

  • RQ1인구 통계적 편향을 보정한 Twitter 감성 데이터는 더 정확한 미국 대선 예측을 가능하게 하는가?
  • RQ2캐논스 자료를 활용한 인구 통계적 보정은 사회적 미디어 기반 대선 예측의 신뢰성에 어떤 영향을 미치는가?
  • RQ3보정된 모델은 보정되지 않은 모델에 비해 실제 2012년 대선 결과와 얼마나 잘 일치하는가?
  • RQ4대통령 토론과 같은 주요 캠페인 행사들이 보정된 감성 추세에 어떤 영향을 미치는가?
  • RQ5다양한 인구 통계적 특성을 지닌 미국 각 주에서 모델은 예측 정확도를 유지하는가?

주요 결과

  • 캐논스 보정 모델은 실제 인기 득표와 2.5%p 이내로 2012년 미국 대선 결과를 예측했다.
  • 인구 통계적 보정은 Twitter 감성 데이터의 편향을 크게 감소시켜 보정되지 않은 모델에 비해 예측 정확도를 향상시켰다.
  • 모델은 대선 토론과 같은 핵심 행사 이후 공중 여론의 변화를 고시간 해상도로 포착했다.
  • 보정된 감성 추세는 원시 Twitter 감성보다 실제 대선 결과와 더 강한 상관관계를 보였다.
  • 모델은 다양한 주에서 뚜렷한 강건성을 보이며, 인구 통계적 가중치의 효과적인 일반화를 입증했다.
  • 본 연구는 사회적 미디어 기반 대선 예측에서 인구 통계적 보정이 필수적임을 확인한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.