Skip to main content
QUICK REVIEW

[論文レビュー] Fake News Detection on Social Media: A Data Mining Perspective

Kai Shu, Amy Sliva|arXiv (Cornell University)|Aug 7, 2017
Misinformation and Its Impacts参考文献 71被引用数 599
ひとこと要約

この調査はデータマイニングの観点からソーシャルメディア上の偽ニュース検出を概観し、定義、特徴(内容と社会的文脈)、検出モデル、データセット、評価指標、および将来の方向性を扱う。

ABSTRACT

Social media for news consumption is a double-edged sword. On the one hand, its low cost, easy access, and rapid dissemination of information lead people to seek out and consume news from social media. On the other hand, it enables the wide spread of "fake news", i.e., low quality news with intentionally false information. The extensive spread of fake news has the potential for extremely negative impacts on individuals and society. Therefore, fake news detection on social media has recently become an emerging research that is attracting tremendous attention. Fake news detection on social media presents unique characteristics and challenges that make existing detection algorithms from traditional news media ineffective or not applicable. First, fake news is intentionally written to mislead readers to believe false information, which makes it difficult and nontrivial to detect based on news content; therefore, we need to include auxiliary information, such as user social engagements on social media, to help make a determination. Second, exploiting this auxiliary information is challenging in and of itself as users' social engagements with fake news produce data that is big, incomplete, unstructured, and noisy. Because the issue of fake news detection on social media is both challenging and relevant, we conducted this survey to further facilitate research on the problem. In this survey, we present a comprehensive review of detecting fake news on social media, including fake news characterizations on psychology and social theories, existing algorithms from a data mining perspective, evaluation metrics and representative datasets. We also discuss related research areas, open problems, and future research directions for fake news detection on social media.

研究の動機と目的

  • 伝統的メディアとソーシャルメディアにおける偽ニュースの定義と特徴を明確にする。
  • ソーシャルメディア上の偽ニュース検出のためのデータマイニング手法を要約する。
  • 内容ベースと社会的文脈ベースの検出手法を比較する。
  • データセット、評価指標、および今後の研究の指針となる未解決問題を論じる。

提案手法

  • 偽ニュース検出手法をニュース内容モデルと社会的文脈モデルに分類する。
  • 内容特徴(言語的および視覚的)と社会的文脈特徴(ユーザー、投稿、ネットワークベース)を説明する。
  • 内容モデルの知識ベースおよびスタイルベース検出アプローチをレビューする。
  • 偽ニュース研究で使用されるデータセットの種類と評価指標の概要を示す。
  • ソーシャルメディア上の検出に関する未解決の問題と今後の方向性を議論する。

実験結果

リサーチクエスチョン

  • RQ1偽ニュースとして用いられる定義は何であり、伝統的メディアとソーシャルメディアでどのように異なるのか?
  • RQ2ニュース内容と社会的文脈からのどの特徴がソーシャルメディアでの偽ニュース検出に有効か?
  • RQ3どのような検出モデルが存在し、入力ソース(内容対文脈)によってどのように分類されるか?
  • RQ4この研究領域で典型的なデータセットと評価指標は何か?
  • RQ5未解決の課題と将来の有望な方向性は何か?

主な発見

  • ソーシャルメディア上の偽ニュースは、ニュース内容の意図的な操作のため、内容だけでは不十分であり補助情報を要する。
  • 社会的文脈特徴(ユーザー、投稿、ネットワーク)は偽ニュース検出の重要な手がかりを提供する。
  • 検出アプローチは、知識ベースおよびスタイルベースの内容モデル、ならびに内容非依存の社会的文脈モデルに分類される。
  • 伝統的な偽ニュースとボット、トロール、エコーチャンバーのようなソーシャルメディア特有のパターンとの区別がある。
  • この分野は初期段階であり、いくつかの未解決課題と今後の研究機会がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。