[论文解读] Modeling public mood and emotion: Twitter sentiment and socio-economic phenomena
本文提出一种基于术语的情感分析方法,利用2008年8月1日至12月20日期间的Twitter数据来建模公众情绪,采用扩展版情绪状态剖面(POMS)提取六种情绪维度。研究发现,重大社会经济与文化事件(如美国总统大选和油价飙升)会引发显著、即时且特定的情绪变化,表明大规模情感分析可作为集体情绪趋势的预测工具。
Microblogging is a form of online communication by which users broadcast brief text updates, also known as tweets, to the public or a selected circle of contacts. A variegated mosaic of microblogging uses has emerged since the launch of Twitter in 2006: daily chatter, conversation, information sharing, and news commentary, among others. Regardless of their content and intended use, tweets often convey pertinent information about their author's mood status. As such, tweets can be regarded as temporally-authentic microscopic instantiations of public mood state. In this article, we perform a sentiment analysis of all public tweets broadcasted by Twitter users between August 1 and December 20, 2008. For every day in the timeline, we extract six dimensions of mood (tension, depression, anger, vigor, fatigue, confusion) using an extended version of the Profile of Mood States (POMS), a well-established psychometric instrument. We compare our results to fluctuations recorded by stock market and crude oil price indices and major events in media and popular culture, such as the U.S. Presidential Election of November 4, 2008 and Thanksgiving Day. We find that events in the social, political, cultural and economic sphere do have a significant, immediate and highly specific effect on the various dimensions of public mood. We speculate that large scale analyses of mood can provide a solid platform to model collective emotive trends in terms of their predictive value with regards to existing social as well as economic indicators.
研究动机与目标
- 探究是否可以使用心理测量工具系统性地测量Twitter微博中反映的公众情绪。
- 评估重大社会经济与文化事件对整体公众情绪随时间变化的影响。
- 评估利用社交媒体中简短、非结构化文本作为大规模情绪趋势代理指标的可行性。
- 建立一种无需依赖机器学习或训练数据的微博内容情感分析方法。
提出的方法
- 应用扩展版情绪状态剖面(POMS)这一成熟的心理测量工具,提取六种情绪维度:紧张、抑郁、愤怒、活力、疲劳和困惑。
- 采用句法驱动的术语分析方法对推文中的情感进行分析,避免使用机器学习或训练数据。
- 处理了2008年8月1日至12月20日期间的所有公开推文,生成每日情绪向量的时间序列。
- 将单条推文的情绪评分聚合为日均值,以表示公众情绪趋势。
- 将每日情绪趋势与外部指标(如股票市场指数、原油价格及重大文化事件)进行对比。
- 通过将情绪维度的时间峰值与已知的社会政治及经济事件对齐,识别出事件特异性的情绪变化。
实验结果
研究问题
- RQ1是否可以使用心理测量工具从简短、非结构化的社交媒体文本中可靠地测量公众情绪?
- RQ2重大社会经济与文化事件是否会引起可测量且即时的公众情绪整体变化?
- RQ3股票市场与原油价格的波动在多大程度上与公众情绪维度的变化相关?
- RQ4微博内容的情感分析在多大程度上可作为集体情绪状态相对于宏观经济趋势的预测指标?
主要发现
- 在重大事件(如2008年11月4日美国总统大选)发生后,观察到显著且即时的情绪变化,表现为活力和困惑感明显上升。
- 2008年10月15日股市暴跌后,紧张、抑郁和愤怒情绪上升,而活力下降。
- 2008年10月原油价格飙升与公众情绪谱系中紧张和疲劳感的增加相关。
- 2008年11月27日感恩节假期与活力感上升及抑郁和困惑感下降存在可测量关联。
- 本研究证明,无需训练数据的基于术语的情感分析方法可有效从微博内容中提取有意义的情绪维度。
- 公众情绪模式与外部社会经济指标表现出强烈的时间对齐,表明其在预测集体情绪趋势方面具有潜在价值。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。