[論文レビュー] Beyond News Contents: The Role of Social Context for Fake News Detection
TriFN は出版者-ニュースの関係とユーザーのエンゲージメントを活用して偽ニュースを検出し、FakeNewsNet のベースラインを上回る(BuzzFeed と PolitiFact)。
Social media is becoming popular for news consumption due to its fast dissemination, easy access, and low cost. However, it also enables the wide propagation of fake news, i.e., news with intentionally false information. Detecting fake news is an important task, which not only ensures users to receive authentic information but also help maintain a trustworthy news ecosystem. The majority of existing detection algorithms focus on finding clues from news contents, which are generally not effective because fake news is often intentionally written to mislead users by mimicking true news. Therefore, we need to explore auxiliary information to improve detection. The social context during news dissemination process on social media forms the inherent tri-relationship, the relationship among publishers, news pieces, and users, which has potential to improve fake news detection. For example, partisan-biased publishers are more likely to publish fake news, and low-credible users are more likely to share fake news. In this paper, we study the novel problem of exploiting social context for fake news detection. We propose a tri-relationship embedding framework TriFN, which models publisher-news relations and user-news interactions simultaneously for fake news classification. We conduct experiments on two real-world datasets, which demonstrate that the proposed approach significantly outperforms other baseline methods for fake news detection.
研究の動機と目的
- コンテンツだけでは不十分なソーシャルメディア時代における偽ニュース検出の動機づけ。
- 伝播ダイナミクスをモデル化するための三者関係(出版者、ニュース、ユーザー)の定義。
- コンテンツ、社会的文脈、相互作用から共同表現を学習する TriFN の開発。
- 実世界データセットの実験を通じて有効性を示す。
提案手法
- 五つの成分を組み合わせた tri-relationship 埋め込みフレームワークである TriFN を提案します。成分はニュース内容の埋め込み、ユーザー埋め込み、ユーザー-ニュース相互作用埋め込み、出版者-ニュース関係埋め込み、半教師付き分類。
- ニュース内容とユーザーを埋め込むために非負行列因子分解(NMF)を用い、それぞれ (D,V) と (U,T)。
- ユーザー信頼度スコアを取り入れて、ユーザー潜在特徴を真偽ラベルへ結ぶ重み付き距離項を介してユーザー-ニュース相互作用学習を導く。
- 出版者の partisan bias を、党派スコアと整列する出版者-ニュース関係埋め込みによって、ラベル付き出版者でモデル化する。
- ニュース潜在特徴からラベルへの線形写像を用いた半教師付き分類器を実装し、D,U,V,T,p,q に渡る交互最小二乗法で最適化する。
実験結果
リサーチクエスチョン
- RQ1TriFN は出版者の partisan bias とユーザーのエンゲージメントを共同でモデリングすることで偽ニュース分類を改善できるか?
- RQ2出版者のバイアスモデリングとユーザーエンゲージメント学習は TriFN の性能にどう寄与するか?
- RQ3ユーザーエンゲージメントが限られている場合に TriFN は早期偽ニュース検出を実現できるか?
主な発見
| データセット | 手法 | 精度 | 適合率 | 再現率 | F1 |
|---|---|---|---|---|---|
| BuzzFeed | TriFN | 0.864±0.026 | 0.849±0.040 | 0.893±0.013 | 0.870±0.019 |
| PolitiFact | TriFN | 0.878±0.017 | 0.867±0.034 | 0.893±0.023 | 0.880±0.015 |
- TriFN は実世界データセット2つ(BuzzFeed と PolitiFact)において F1 スコアおよび他の指標でベースラインを大幅に上回る。
- BuzzFeed では TriFN が F1=0.870 を達成し、RST (0.633) および LIWC+Castillo (0.822) を上回る。
- PolitiFact では TriFN が F1=0.880 を達成し、RST (0.615) および LIWC+Castillo (0.843) を上回る。
- 本フレームワークは出版者の partisan bias とユーザーの信頼性を活用してニュース表現と偽ニュース予測を改善する。
- FakeNewsNet で 80-20 のトレイン-テスト分割を用い、10 回の実行を平均して実験を行う。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。