QUICK REVIEW

[論文レビュー] This Just In: Fake News Packs a Lot in Title, Uses Simpler, Repetitive Content in Text Body, More Similar to Satire than Real News

Benjamin D. Horne, Sibel Adalı|arXiv (Cornell University)|Mar 28, 2017

Misinformation and Its Impacts被引用数 48

ひとこと要約

本研究は、フェイクニュース、本物のニュース、パロディニュースの間のスタイル的差異を3つのデータセットを用いて分析し、フェイクニュースの見出しはより長く、固有名詞を多く使い、ストップワードは少ない一方、本文は短く、繰り返しが多く、複雑さに欠けることを明らかにした。特に重要なのは、フェイクニュースは本物のニュースよりもパロディニュースにスタイルでより似ており、論理的議論ではなくヒューリスティックな説得に依存していることを示しており、見出しは深く読み込まない読者に対して主に説得的役割を果たしていることである。

ABSTRACT

The problem of fake news has gained a lot of attention as it is claimed to have had a significant impact on 2016 US Presidential Elections. Fake news is not a new problem and its spread in social networks is well-studied. Often an underlying assumption in fake news discussion is that it is written to look like real news, fooling the reader who does not check for reliability of the sources or the arguments in its content. Through a unique study of three data sets and features that capture the style and the language of articles, we show that this assumption is not true. Fake news in most cases is more similar to satire than to real news, leading us to conclude that persuasion in fake news is achieved through heuristics rather than the strength of arguments. We show overall title structure and the use of proper nouns in titles are very significant in differentiating fake from real. This leads us to conclude that fake news is targeted for audiences who are not likely to read beyond titles and is aimed at creating mental associations between entities and claims.

研究の動機と目的

フェイクニュース、本物のニュース、パロディニュースの記事における体系的なスタイル的・言語的差異を調査すること。
フェイクニュースが本物のニュースを模倣するために書かれているのか、それとも説得戦略においてパロディニュースに似ているのかを特定すること。
言語的・構造的特徴の予測的パワーが、フェイクニュースと本物のニュース・パロディニュースを区別する上でどの程度有効であるかを評価すること。
これらの発見が、フェイクニュースが合理的な議論ではなくヒューリスティック処理を通じて広がることを理解する上でどのような意味を持つのかを探ること。

提案手法

本研究は、2016年米国大統領選挙のニュースに関するBuzzfeedのデータセット、研究者が収集した米国政治ニュースの実際のニュース、フェイクニュース、パロディニュースのデータセット、および過去の研究から得たパロディニュースと本物のニュースのデータセットの3つの異なるデータセットを分析する。
見出しの長さ、ストップワードの使用、固有名詞、標点、本文内の繰り返しといった言語的・スタイル的特徴を抽出する。
統計的分析と線形カーネルSVMを用いて、これらの特徴に基づき記事をフェイク、本物、パロディに分類する。
説得における周辺的プロセッシングと中心的プロセッシングの役割を解釈する理論的枠組みとして、熟考の可能性モデル（ELM）を適用する。
どの言語的手がかりがフェイクニュースと本物のニュース・パロディニュースを最も強く区別するかを特定するため、特徴の重要度を評価する。
小さな特徴サブセットを用いた精度指標を用いて予測性能を評価し、同定された特徴の有効性を検証する。

実験結果

リサーチクエスチョン

RQ1フェイクニュースの言語的・スタイル的特徴は、本物のニュースやパロディニュースとどのように体系的に異なるか？
RQ2フェイクニュースは、本物のニュースよりもパロディニュースにどの程度スタイルで類似しているか？
RQ3フェイクニュース記事は、本文の論理的議論よりも、見出しにおけるヒューリスティックな手がかりに依存しているか？
RQ4見出しの長さ、固有名詞の使用、繰り返しといった単純な言語的特徴が、フェイクニュースの内容を効果的に予測できるか？
RQ5認知的ヒューリスティック、特に周辺的プロセッシングは、フェイクニュースの広がりと説得にどの程度寄与しているか？

主な発見

フェイクニュースの見出しは、本物のニュースと比較して有意に長く、固有名詞と動名詞句を多く含み、ストップワードと名詞の使用は少ない。
フェイクニュースの本文は、本物のニュースと比較して短く、繰り返しが多く、句読点の使用も少ないことから、言語的複雑さが低いことが示唆される。
言語的スタイルの観点から、フェイクニュースは本物のニュースよりもパロディニュースと統計的に類似しており、共通の説得戦略を共有している可能性がある。
線形カーネルSVMは、わずかな言語的特徴のセットのみを用いても、フェイクニュースと本物のニュース・パロディニュースを区別する分類精度が71％から91％の間で達成された。
研究結果は熟考の可能性モデル（ELM）を支持しており、フェイクニュースが中心的プロセッシング（論理的議論）ではなく、周辺的プロセッシング（見出しのヒューリスティックな手がかり）に依存して説得していることを示している。
本研究は、フェイクニュースは内容を深く読み込まない読者を想定して設計されており、見出しに基づくヒューリスティックが主な影響メカニズムであると結論づける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。