[論文レビュー] Twitter mood predicts the stock market
本稿では、2008年の985万件のツイートを対象に、Twitterのマイクロブログから導出された一般感情がダウ・ジョーンズ工業平均(DJIA)の日々の変動を予測できることを提案している。感情分析ツール(OpinionFinderとGPOMS)を用いて分析した結果、特に「落ち着き」(Calm)と「幸せ」(Happy)という感情次元が、DJIAの方向変動予測の正確性を87.6%まで向上させ、平均絶対誤差(MAPE)を6%以上低減した。
Behavioral economics tells us that emotions can profoundly affect individual behavior and decision-making. Does this also apply to societies at large, i.e., can societies experience mood states that affect their collective decision making? By extension is the public mood correlated or even predictive of economic indicators? Here we investigate whether measurements of collective mood states derived from large-scale Twitter feeds are correlated to the value of the Dow Jones Industrial Average (DJIA) over time. We analyze the text content of daily Twitter feeds by two mood tracking tools, namely OpinionFinder that measures positive vs. negative mood and Google-Profile of Mood States (GPOMS) that measures mood in terms of 6 dimensions (Calm, Alert, Sure, Vital, Kind, and Happy). We cross-validate the resulting mood time series by comparing their ability to detect the public's response to the presidential election and Thanksgiving day in 2008. A Granger causality analysis and a Self-Organizing Fuzzy Neural Network are then used to investigate the hypothesis that public mood states, as measured by the OpinionFinder and GPOMS mood time series, are predictive of changes in DJIA closing values. Our results indicate that the accuracy of DJIA predictions can be significantly improved by the inclusion of specific public mood dimensions but not others. We find an accuracy of 87.6% in predicting the daily up and down changes in the closing values of the DJIA and a reduction of the Mean Average Percentage Error by more than 6%.
研究の動機と目的
- Twitterのコンテンツに反映された集団的一般感情が、株価動向を予測できるかどうかを調査すること。
- 特に「落ち着き」「幸せ」「鋭い」などの特定の感情次元がDJIAに与える予測力の有効性を評価すること。
- 実世界の出来事(例:サンクスギビングデー、米大統領選挙)を用いて、感情時系列の信頼性を検証すること。
- ソーシャルメディアからの一般感情データを統合することで、標準的な株価予測モデルの性能を向上させること。
- 特定の感情次元が他のものよりも予測力に優れているかどうか、また一般感情の指標だけで十分かどうかを特定すること。
提案手法
- 2008年2月28日から12月19日までに、TwitterのパブリックAPIを用いて9,853,498件のパブリックツイートを収集した。
- ツイート本文から感情分析ツールOpinionFinderを用いて、日次単位のポジティブ/ネガティブ感情時系列を抽出した。
- 同じツイートコーパスを用いて、GPOMSを用いて6次元の感情時系列(Calm, Alert, Sure, Vital, Kind, Happy)を生成した。
- クロスバリデーションとして、既知の出来事(2008年のサンクスギビングデーと2008年米国大統領選挙)に対する感情時系列の反応を比較した。
- Granger因果関係分析を実施し、感情時系列がDJIAの変化を予測できるかどうかを検証した。
- 自己組織的ファジィニューラルネットワーク(SOFNN)を用いて、感情特徴量を活用し、DJIAの予測精度を向上させるモデルを構築した。
実験結果
リサーチクエスチョン
- RQ1Twitterフィードから導出された一般感情は、DJIAの日々の方向変動を予測できるか?
- RQ2「落ち着き」「幸せ」「鋭い」などの特定の感情次元の中で、どの次元がDJIAの変動を最もよく予測できるか?
- RQ3感情データを組み込むことで、標準的なモデルよりも予測精度が顕著に向上するか?
- RQ4感情時系列は、選挙や休日といった実世界の出来事に対する反応をどれほど正確に捉えられるか?
- RQ5一般感情と株価動向の間に因果関係があるのか、それとも単なる相関関係にとどまるのか?
主な発見
- 特に「落ち着き」と「幸せ」の感情次元を組み込むことで、DJIAの方向変動予測の正確性が顕著に向上し、87.6%まで達した。
- 感情特徴量を組み込むことで、DJIA予測の平均絶対誤差(MAPE)が6%以上低減した。
- GPOMSが生成した「落ち着き」と「幸せ」の次元が、OpinionFinderが提供する一般的なポジティブ/ネガティブ感情よりも強い予測力を持っていた。
- クロスバリデーションの結果、感情時系列がサンクスギビングデーと2008年米国大統領選挙といった主要出来事に対する一般の反応を正確に捉えていることが確認された。
- すべての感情次元が予測力を持つわけではない。例えば、OpinionFinderの一般的な「幸せ」次元は予測性能の向上に寄与しなかった。
- Granger因果関係検定の結果、特に「落ち着き」と「幸せ」の次元における一般感情が、DJIAの変動を先行して予測している統計的証拠が得られた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。