[論文レビュー] Modeling public mood and emotion: Twitter sentiment and socio-economic phenomena
本稿では、2008年8月1日から12月20日までのTwitterデータを用いて、公共の気分をモデル化するための語句ベースのセンチメント分析手法を提案する。拡張された気分状態プロファイル(POMS)を用いて6つの気分次元を抽出した。主要な社会的・経済的・文化的な出来事、たとえば米国大統領選挙や原油価格の急騰といった出来事は、公共の気分に顕著で即時の、かつ特定の変化を引き起こすことが判明した。これは、大規模なセンチメント分析が集団的な感情的傾向を予測するツールとして機能しうることを示している。
Microblogging is a form of online communication by which users broadcast brief text updates, also known as tweets, to the public or a selected circle of contacts. A variegated mosaic of microblogging uses has emerged since the launch of Twitter in 2006: daily chatter, conversation, information sharing, and news commentary, among others. Regardless of their content and intended use, tweets often convey pertinent information about their author's mood status. As such, tweets can be regarded as temporally-authentic microscopic instantiations of public mood state. In this article, we perform a sentiment analysis of all public tweets broadcasted by Twitter users between August 1 and December 20, 2008. For every day in the timeline, we extract six dimensions of mood (tension, depression, anger, vigor, fatigue, confusion) using an extended version of the Profile of Mood States (POMS), a well-established psychometric instrument. We compare our results to fluctuations recorded by stock market and crude oil price indices and major events in media and popular culture, such as the U.S. Presidential Election of November 4, 2008 and Thanksgiving Day. We find that events in the social, political, cultural and economic sphere do have a significant, immediate and highly specific effect on the various dimensions of public mood. We speculate that large scale analyses of mood can provide a solid platform to model collective emotive trends in terms of their predictive value with regards to existing social as well as economic indicators.
研究の動機と目的
- Twitterのマイクロブログに反映される公共の気分が、心理学的測定道具を用いて体系的に測定可能かどうかを調査すること。
- 主な社会的・経済的・文化的出来事が、時間の経過とともに集計された公共の気分に与える影響を評価すること。
- 短い、非構造的なテキストが、大規模な感情的傾向の代理として使用可能かどうかを評価すること。
- 機械学習やトレーニングデータに依存しない、マイクロブログコンテンツのセンチメント分析手法を確立すること。
提案手法
- 心理的測定道具として広く知られた、拡張された気分状態プロファイル(POMS)を用い、緊張、抑うつ、怒り、活力、疲労、混乱の6つの気分次元を抽出した。
- 機械学習やトレーニングデータを避けるために、文法的・語彙ベースのアプローチを用いてツイートのセンチメントを分析した。
- 2008年8月1日から12月20日までの全公開ツイートを処理し、気分ベクトルの日次時系列データを生成した。
- 個々のツイートの気分スコアを日次平均に集約し、公共の気分の傾向を表現した。
- 株価指数、原油価格、主要な文化的出来事といった外部指標と、日々の気分傾向を比較した。
- 主な社会的・政治的・経済的出来事と一致する気分次元の時間的ピークを特定することで、出来事特有の気分の変化を同定した。
実験結果
リサーチクエスチョン
- RQ1短い、非構造的なソーシャルメディアのテキストから、心理学的測定道具を用いて公共の気分を信頼性高く測定可能か?
- RQ2主な社会的・経済的・文化的出来事が、集計された公共の気分に測定可能で即時の変化を引き起こすか?
- RQ3株価や原油価格の変動が、公共の気分次元の変化とどの程度相関しているか?
- RQ4マイクロブログデータのセンチメント分析は、マクロ経済動向と関連して、集団的な感情状態を予測する指標として機能可能か?
主な発見
- 2008年11月4日に行われた米国大統領選挙に伴い、活力と混乱の著しい増加を伴う顕著で即時の気分の変化が観察された。
- 2008年10月15日における株価の急落は、緊張、抑うつ、怒りの増加と活力の低下を伴い、その後に続いた。
- 2008年10月の原油価格の急騰は、公共の気分全体にわたり、緊張と疲労の増加と相関した。
- 2008年11月27日に行われた感謝祭の休日は、活力の有意な増加と抑うつ・混乱の低下に関連していた。
- 本研究では、トレーニングデータを一切使用しない語彙ベースのセンチメント分析が、マイクロブログコンテンツから意味のある気分次元を効果的に抽出できることを示した。
- 公共の気分のパターンは、外部の社会的・経済的指標と強く時間的整合性を示しており、集団的な感情的傾向の予測可能性を示唆している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。