Skip to main content
QUICK REVIEW

[论文解读] Combating Fake News: A Survey on Identification and Mitigation Techniques

Karishma Sharma, Feng Qian|arXiv (Cornell University)|Jan 18, 2019
Misinformation and Its Impacts参考文献 111被引用 73
一句话总结

本综述全面评估假新闻检测与缓解方法,分析挑战,并汇集现有数据集以指导端到端解决方案和未来研究。

ABSTRACT

The proliferation of fake news on social media has opened up new directions of research for timely identification and containment of fake news, and mitigation of its widespread impact on public opinion. While much of the earlier research was focused on identification of fake news based on its contents or by exploiting users' engagements with the news on social media, there has been a rising interest in proactive intervention strategies to counter the spread of misinformation and its impact on society. In this survey, we describe the modern-day problem of fake news and, in particular, highlight the technical challenges associated with it. We discuss existing methods and techniques applicable to both identification and mitigation, with a focus on the significant advances in each method and their advantages and limitations. In addition, research has often been limited by the quality of existing datasets and their specific application contexts. To alleviate this problem, we comprehensively compile and summarize characteristic features of available datasets. Furthermore, we outline new directions of research to facilitate future development of effective and interdisciplinary solutions.

研究动机与目标

  • 定义假新闻并描述信息生态系统中的维度与参与者。
  • 概述检测技术与缓解/干预策略及其优点与局限性。
  • 汇总并描述可用数据集以帮助数据集选择与方法评估。
  • 讨论端到端系统要求与主动干预的开放研究方向。

提出的方法

  • 对文献中的检测与缓解方法进行调研与综合。
  • 按内容特征、用户响应和传播模式对技术进行分类。
  • 编汇并总结可用的假新闻数据集及其特征。
  • 讨论挑战、对抗性动态与实际审核考虑。
  • 提出检测与干预工作流的端到端设计考虑。

实验结果

研究问题

  • RQ1在内容、来源与用户响应属性方面,假新闻的定义特征与维度是什么?
  • RQ2存在哪些检测假新闻并减缓传播的技术,它们的优点与局限性是什么?
  • RQ3可用于假新闻研究的数据集有哪些,它们的特征是什么?
  • RQ4构建端到端的假新闻检测与干预系统面临哪些挑战与需求?
  • RQ5如何在检测与审核之间取得平衡,以确保及时且可靠的干预?

主要发现

  • 假新闻可以定义为涵盖加工、误导、冒充、操纵及情境性虚假内容,且具有不同的意图。
  • 检测技术涵盖内容分析、社交上下文和传播模式,每种都有不同的局限性和性能权衡。
  • 用户响应与扩散动态通常为检测提供比仅内容更强的信号。
  • 存在多种带有不同注释的数据集,强调在公平评估中需谨慎选择数据集并标准化。
  • 端到端解决方案需要在积极审核与快速信息获取之间取得平衡,并应利用逐步可获得的数据来权衡时效性与准确性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。