Skip to main content
QUICK REVIEW

[論文レビュー] Cross-language sentiment analysis of European Twitter messages duringthe COVID-19 pandemic

Anna Kruspe, Matthias Häberle|arXiv (Cornell University)|Aug 27, 2020
Misinformation and Its Impacts被引用数 23
ひとこと要約

本研究では、4.6百万件の地理タグ付きヨーロッパのツイート(2019年12月から2020年4月)を対象に、文の埋め込みを用いた多言語ニューラルネットワークを適用して感情分析を実施した。その結果、封鎖措置の発表が大多数の国で一時的に顕著な感情の低下を引き起こしたが、数週間で回復した。ドイツでは、より緩い措置と文化的要因の影響で、感情の曲線が他国と比較して否定的傾向が弱く、封鎖発表後も顕著な低下を示さなかった。

ABSTRACT

Social media data can be a very salient source of information during crises. User-generated messages provide a window into people's minds during such times, allowing us insights about their moods and opinions. Due to the vast amounts of such messages, a large-scale analysis of population-wide developments becomes possible. In this paper, we analyze Twitter messages (tweets) collected during the first months of the COVID-19 pandemic in Europe with regard to their sentiment. This is implemented with a neural network for sentiment analysis using multilingual sentence embeddings. We separate the results by country of origin, and correlate their temporal development with events in those countries. This allows us to study the effect of the situation on people's moods. We see, for example, that lockdown announcements correlate with a deterioration of mood in almost all surveyed countries, which recovers within a short time span.

研究の動機と目的

  • COVID-19パンデミックの初期段階におけるヨーロッパのツイッターデータにおける集団的感情傾向を分析すること。
  • 封鎖措置の発表や感染者数の増加といった国家的政策イベントと、一般の感情がどの程度相関しているかを調査すること。
  • ヨーロッパ圏外のデータセットで訓練された多言語感情分析モデルが、言語を超えた感情検出にどの程度効果的に適用できるかを評価すること。
  • 国ごとの感情パターンを比較し、文化的要因や政策的要因が一般の気分に与える影響を特定すること。

提案手法

  • グローバルなボクシングボックスを用い、ヨーロッパ地域の点をポリゴン内に含むかをテストすることで、2019年12月から2020年4月にかけて4.68百万件の地理タグ付き多言語ツイートをTwitter APIで収集した。
  • 事前学習済みの多言語文の埋め込みを用い、128ユニットのReLU層と、0(否定的)から1(肯定的)の間の感情スコアを出力するシグモイド出力層を持つニューラルネットワークを、Sentiment140データセットで学習させた。
  • 訓練中に平均二乗誤差損失関数と50%のドロップアウトを用いて正則化を行った。
  • 国と時間帯ごとに感情分析結果をセグメント化し、COVID-19関連キーワードを含むツイートについても別個に分析した。
  • 時間的整合性を保ちながら、封鎖措置の発表や感染者数の増加といった国家的出来事と感情傾向を相関させた。
  • 多言語文の埋め込みにはHugging Face Transformersライブラリを用い、モデルの性能はSentiment140テストセットで評価した。

実験結果

リサーチクエスチョン

  • RQ1COVID-19パンデミックの初期段階において、ヨーロッパ諸国のツイッター上での一般の感情はどのように変化したか?
  • RQ2封鎖措置の発表などの国家的政策イベントが、集団的気分の変化とどの程度相関しているか?
  • RQ3COVID-19関連キーワードを含むツイートの感情は、各国の全体的な感情傾向と比べてどう異なるか?
  • RQ4ドイツは他のヨーロッパ諸国と比較して、感情レベルや封鎖措置への反応において明確に異なるパターンを示すのはなぜか?
  • RQ5ヨーロッパ圏外のデータセットで訓練された感情モデルが、多言語のヨーロッパのツイッターデータに効果的に一般化できるか?

主な発見

  • 大多数のヨーロッパ諸国で、封鎖措置の発表後に平均的な感情が顕著に一時的に低下したが、数週間で回復した。
  • COVID-19関連キーワードを含むツイートの感情は、使用頻度が上昇し始めた初期に非常に否定的だったが、時間の経過とともに徐々に肯定的になり、ドイツを除く全国で全体の平均より低かった。
  • ドイツでは全体的に否定的傾向が弱く、2020年3月の封鎖措置発表後も顕著な低下を示さなかった。これは、措置がより緩く、政府の対応に対する公的評価が高かった可能性がある。
  • イギリスでは、3月上旬に感情のピークが観察されたが、これは政府の初期段階での封鎖措置の不採用に起因する可能性がある。その後感情は低下し、研究期間中は回復しなかった。
  • 2019年12月から2020年4月にかけてヨーロッパ全体で感情が低下する傾向が見られ、感染者数の増加や政策変更といった重要なパンデミックの出来事と感情の低下が一致した。
  • モデルはSentiment140テストセットで優れた性能を示し、平均二乗誤差(MSE)が0.028であった。これは、ヨーロッパ圏外のデータセットで学習させたにもかかわらず、信頼できる感情分類が可能であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。