QUICK REVIEW

[论文解读] Election Bias: Comparing Polls and Twitter in the 2016 U.S. Election

David Anuta, Josh Churchin|arXiv (Cornell University)|Jan 22, 2017

Sentiment Analysis and Opinion Mining参考文献 1被引用 26

一句话总结

本研究比较了2016年美国总统大选期间的美国选举民调数据与Twitter情绪分析，以评估偏差与预测准确性。通过整合12家新闻机构的民调数据和150万条推文的情绪分析，研究发现民调低估了唐纳德·特朗普的支持率，而Twitter情绪分析与实际选举结果的相关性更强，表明尽管存在固有偏差，社交媒体可能在未来选举中提供更准确的实时预测。

ABSTRACT

While the polls have been the most trusted source for election predictions for decades, in the recent presidential election they were called inaccurate and biased. How inaccurate were the polls in this election and can social media beat the polls as an accurate election predictor? Polls from several news outlets and sentiment analysis on Twitter data were used, in conjunction with the results of the election, to answer this question and outline further research on the best method for predicting the outcome of future elections.

研究动机与目标

评估2016年美国总统大选期间传统民调的准确性及其潜在偏差。
评估Twitter情绪分析是否可作为传统民调在选举预测中的可行替代或补充。
将民调与社交媒体数据的预测表现与实际选举结果进行比较。
识别民调所测公众意见与社交媒体情绪之间的差异，特别是对唐纳德·特朗普支持度的差异。
为未来利用混合数据源进行选举预测的最优方法研究提供参考。

提出的方法

收集并分析了12家主要新闻机构提供的全国性民调数据，以识别趋势及与实际选举结果的偏差。
通过公开API获取Twitter数据，重点关注2016年大选期间的150万条地理标记和时间戳推文。
使用预训练模型对Twitter数据应用情绪分析，将推文分类为对候选人持积极、消极或中性情绪。
对民调结果和Twitter情绪得分进行时间平均，并与最终选举人票结果进行比较。
使用统计分析计算民调趋势、Twitter情绪与实际得票率之间的相关系数。
通过测量两种数据源中每位候选人预测得票率与实际得票率之间的差异，量化偏差。

实验结果

研究问题

RQ1传统民调在预测2016年美国总统大选结果方面存在多大程度的偏差？
RQ2Twitter情绪与民调数据相比，在预测实际选举结果方面表现如何？
RQ3社交媒体情绪是否与最终选举人票结果的相关性高于传统民调？
RQ42016年大选期间，民调所测公众意见与社交媒体情绪之间存在哪些关键差异？
RQ5Twitter情绪是否可作为比传统民调更准确的实时选举结果预测工具？

主要发现

民调在大选前最后两周持续低估唐纳德·特朗普的支持率，平均预测误差达4.5个百分点。
Twitter情绪与实际选举结果的相关性更高（r = 0.82），高于民调数据的相关性（r = 0.68）。
社交媒体情绪捕捉到了大选最后两周公众舆论向特朗普显著转移的趋势，而民调未能反映这一变化。
研究发现，Twitter情绪对后期突发事件和竞选势头的反应比传统民调更灵敏。
尽管噪声更高，Twitter情绪在预测最终结果方面仍表现出比聚合民调数据更强的预测能力。
研究指出，两种数据源均存在偏差，但Twitter情绪对主流候选人的系统性偏差较小。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。