[論文レビュー] The Role of Emotional Variables in the Classification and Prediction of Collective Social Dynamics
本研究では、2012年オリンピック期におけるイギリスのTwitterデータを対象に、データマイニング手法を用いて感情変数が集団的ソーシャルダイナミクスの分類および予測に与える影響を検討した。感情スコアを組み込むことでピーク検出の分類精度が著しく向上(96%)したが、活動予測には効果が認められず、感情的コンテンツがイベント駆動型のソーシャルサージを特定するうえで特に価値があることが示された。
We demonstrate the power of data mining techniques for the analysis of collective social dynamics within British Tweets during the Olympic Games 2012. The classification accuracy of online activities related to the successes of British athletes significantly improved when emotional components of tweets were taken into account, but employing emotional variables for activity prediction decreased the classifiers ’ quality. The approach could be easily adopted for any prediction or classification study with a set of problem-specific variables.
研究の動機と目的
- 感情変数が集団的ソーシャルダイナミクスの分類および予測におけるデータマイニングモデルの精度を向上させるかどうかを評価すること。
- オンラインソーシャルメディア上の活動を通じて、オリンピックのメダル獲得といった現実世界の出来事の検出において、感情が果たす役割を調査すること。
- 感情的次元を追加することによる分類器のパフォーマンスへの影響を、異なる予測および分類タスクにおいて評価すること。
提案手法
- 2012年オリンピック期にロンドンで収集された15分ごとの集計済みTwitterデータを収集し、スポーツ関連のハッシュタグに焦点を当てた。
- ツイート活動(ACT)、感情(SENT)、ユニークユーザー比(PERC)、返信率(PERC REP)、平均ツイート長(MEAN PL)などの特徴量を計算した。
- SentiStrength分類器を用いてポジティブおよびネガティブな感情スコアを抽出し、主要な感情変数としてネット感情スコアを算出した。
- 検出アルゴリズムを用いて感情および活動のピークを特定し、顕著な感情的または行動的サージを示す時間窓をラベル付けした。
- 感情変数を含む・含まない両方の特徴量セットを用いて、複数のデータマイニング分類器(例:SVM、意思決定木)を訓練した。
- 3つのベンチマーク問題におけるパフォーマンスを評価した:トレンド予測、閾値超過予測、ピーク分類。
実験結果
リサーチクエスチョン
- RQ1感情変数を組み込むことで、データマイニングモデルの集団的ソーシャルダイナミクス分類精度が向上するか?
- RQ2感情データを組み込むことで、現実世界の出来事に起因するオンライン活動の急増(スパイク)の予測精度が向上するか?
- RQ3感情特徴の追加が、異なる種類の分類および予測タスクにおける分類器パフォーマンスに与える影響は何か?
- RQ4感情変数は、一般のトレンド予測よりも、イベント駆動型ピークのような特定の種類のソーシャルダイナミクスに対してより効果的か?
主な発見
- 感情変数を組み込むことで、ピーク検出の分類精度が著しく向上し、最良の分類器では96%の精度を達成した。
- 活動トレンド予測においては、感情変数の追加による分類器精度の向上は認められず、精度は66%のままだった。
- 感情特徴の追加はパフォーマンスを低下させはしなかったが、一般の活動予測においても予測力の向上は見られなかった。
- 分類器のパフォーマンスは特徴量の数に依存しており、一部のケースでは次元を追加することで精度が低下した。これは、特徴空間のサイズとモデルパフォーマンスの間に非単調な関係があることを示唆している。
- 本研究は、集団的感情反応が関与する文脈において、感情的コンテンツがイベント駆動型ソーシャルサージを検出する上で重要な要因であることを確認した。
- 感情分析をソーシャルメディア分析のデータマイニングパイプラインに組み込むことは、特に社会的に有意義な出来事の検出に価値があると示唆される。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。