[論文レビュー] A first look at COVID-19 information and misinformation sharing on Twitter
この研究は、COVID-19関連の Twitter 会話の量、テーマ、地理的信号、神話、情報の質を 2020年1月16日から3月15日まで分析し、ケース拡大の潜在的な先行指標と誤情報の蔓延を強調する。
Since December 2019, COVID-19 has been spreading rapidly across the world. Not surprisingly, conversation about COVID-19 is also increasing. This article is a first look at the amount of conversation taking place on social media, specifically Twitter, with respect to COVID-19, the themes of discussion, where the discussion is emerging from, myths shared about the virus, and how much of it is connected to other high and low quality information on the Internet through shared URL links. Our preliminary findings suggest that a meaningful spatio-temporal relationship exists between information flow and new cases of COVID-19, and while discussions about myths and links to poor quality information exist, their presence is less dominant than other crisis specific themes. This research is a first step toward understanding social media conversation about COVID-19.
研究の動機と目的
- 初期の outbreak 期間中の Twitter における COVID-19 会話の規模と成長を測定する。
- 地理的信号と言語を含む支配的なテーマと議論の起源を特定する。
- 神話の存在と性質、及び時間とともにその普及度を評価する。
- Twitter ユーザーが高品質情報源と低品質情報源、及びニュースソースへのリンクをどのように共有するかを検証する。
- 場所ベースの Twitter 信号が報告された COVID-19 疫病の症例数と関連するか、また会話が先行指標となり得るかを検討する。
提案手法
- COVID-19 ハッシュタグのセットを使用して、2020-01-16 から 2020-03-15 までの Twitter Streaming API から COVID-19 関連ツイートを収集する。
- ツイートを言語別に分類し、時系列を行動的に分析して成長パターンと異文化間差を評価する。
- WikipediaとStatoidsから場所オントロジーを構築してツイート内の場所言及をラベル付けし、利用可能な場合は地理タグ付きツイートを分析する。
- 頻繁に現れる非ストップワードのオープンコーディングによって8つの高レベルのコンテンツテーマを特定し、過半数決定でツイートをテーマに割り当てる。
- 手動のキーワード/フレーズマッチングによってCOVID-19に関する神話を抽出・分類し、日次カウントへの確率的帰属を行う。
- URL の共有を評価して情報の質を測定するため、ドメインを高品質な医療情報源(HQHS)と低品質/誤情報源(LQMS)にマッピングし、ツイートとリツイートでの出現を分析する。
- MediaBias/FactCheck の信頼できるニュースドメインリストを用いてニュースドメインの共有を評価し、ニュース記事中の HQHS と LQMS のリンクの比率を分析する。
実験結果
リサーチクエスチョン
- RQ1初期アウトブレイク期間中の Twitter における COVID-19 議論の量と推移はどのようか。
- RQ2どの言語が支配的で、トピック/テーマは時間とともにどのように進展するか。
- RQ3Twitter の場所言及は公式の COVID-19 の症例数と相関する、またはそれを先行するか、Twitter は先行指標となり得るか。
- RQ4どのCOVID-19 に関する神話が現れ、研究期間を通じてその普及度はどのように変化するか。
- RQ5ユーザーは高品質源と低品質源からの情報をどのように共有し、ニュースメディアは情報拡散にどのような役割を果たしているか。
主な発見
- COVID-19関連ツイートの総数: 2,792,513 のオリジナルツイート、456,878 の引用ツイート、そして 18,168,161 のリツイート。
- 英語がツイートの 57.1%、スペイン語が 11.6%、フランス語 6.5%、イタリア語 4.8%;初期は中国関連語が高く表れた。
- 会話の場所言及と地理タグ付きツイートは公式の症例数と相関する(中国を除くと相関約 0.75)
- 場所ベースの会話と報告された症例のリードタイムは国により異なる(USA 約2日、イタリア 約4–5日、中国・B 約4–5日)、ソーシャルメディア信号の予測的価値を示唆している。
- 8つのテーマを特定;健康/ウイルスとグローバル性がそれぞれラベル付けされた内容の約30%、情報提供者が約11%、感情が約9%;テーマの普及は米国の流行拡大に伴って増加。
- 約16,000ツイート(約0.6%)が5つのターゲット神話を論じている;ウイルスの起源が初期に優勢で、インフルエンザ比較と家庭療法が後に増加。
- URL はオリジナルツイートの 40.5%、引用は 5.1%、リツイートは 9.6% に現れる;HQHS と LQMS のリンクは稀だが LQMS のリンクのリツイートが多い。
- ニュース共有はオリジナルツイートの 13% がニュースURLを含むことを示す;HQHS リンクは記事の約 6.3%、LQMS は約 0.3%、長尾ドメインの大半は HQHS ソースを好む。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。