[論文レビュー] Polarization and Fake News: Early Warning of Potential Misinformation Targets
著者らは、偽ニュースで悪用される可能性が高いトピックを事前にフラグするための一般的なフレームワークを提示します。イタリアのFacebookデータで77%のトピックレベルの精度、偽ニュース検出の特徴として使用した場合は91%の精度を検証。
Users polarization and confirmation bias play a key role in misinformation spreading on online social media. Our aim is to use this information to determine in advance potential targets for hoaxes and fake news. In this paper, we introduce a general framework for promptly identifying polarizing content on social media and, thus, "predicting" future fake news topics. We validate the performances of the proposed methodology on a massive Italian Facebook dataset, showing that we are able to identify topics that are susceptible to misinformation with 77% accuracy. Moreover, such information may be embedded as a new feature in an additional classifier able to recognize fake news with 91% accuracy. The novelty of our approach consists in taking into account a series of characteristics related to users behavior on online social media, making a first, important step towards the smoothing of polarization and the mitigation of misinformation phenomena.
研究の動機と目的
- 誤情報を緩和するために、ユーザの分極化と確認バイアスを活用する動機付け。
- 一般的でプラットフォームに依存しないフレームワークを開発し、偽ニュースの標的になる前に分極的なトピックを識別する。
- トピックと感情を抽出し、行動ベースの特徴を導出し、機械学習を適用して潜在的な誤情報ターゲットを分類する。
- 大規模なイタリアのFacebookデータセットでフレームワークを実証し、偽ニュース検出を向上させる特徴としての有用性を示す。
提案手法
- 公式ソースおよび偽情報ソースからのデータ収集、トピック抽出と感情分析、特徴量定義、分類という4段階のフレームワーク。
- 提示距離、応答距離、論争、認識、捕捉の含むエンティティレベルの感情とトピック特徴。
- 複数のアルゴリズム(Linear Regression, Logistic Regression, SVM, KNN, Neural Networks, Decision Trees)を用いたデータのバランシングを行った教師あり分類。
- 閾値ベースの特徴量構築を用いて、論争性のあるエンティティとそうでないエンティティを分離し、潜在的な誤情報ターゲットを同定。
- 正確さ、適合率、再現率、F1、FP率、AUCを用いて分類器を比較し、最良のモデルを選択する評価。
実験結果
リサーチクエスチョン
- RQ1ソーシャルメディア上で誤情報に susceptible な分極的なトピックを迅速に識別できるか?
- RQ2分極化ベースの特徴は将来の誤情報ターゲットを予測するのにどれくらい効果的か?
- RQ3分極化由来のシグナルは偽ニュースの検出精度を向上させる有用な特徴として機能するか?
- RQ4誤情報ターゲットになりやすいトピックとそうでないトピックを区別する主要な行動特徴は何か?
主な発見
- フレームワークは77%の精度(0.73 AUC)で分極的なトピックを識別。
- 特徴として取り入れた場合、偽ニュース検出は91%の精度(0.94 AUC)に向上。
- 提示距離と応答距離は、論争のあるトピックを区別する最も強力な特徴の1つ。
- 閾値ベースの特徴(論争、認識、捕捉を制御)により、論争的なトピックと非論争的トピックを分離。
- 大規模なイタリアのFacebookデータセットの分析では、トピックが公式ニュースに初めて現れてから偽ニュースに初めて現れるまで約24時間が経過し、多くのトピックが両方の領域で拡散している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。