[论文解读] Solutions to Detect and Analyze Online Radicalization : A Survey
本综述回顾了2003年至2011年间关于社交媒体平台(如Twitter、Facebook和YouTube)上在线极端化自动化检测与分析的40篇论文。它提出了一种新颖的多层级分类法,按模态、特征类型、评估方式和分析方法对技术进行分类,识别出在基于活动的检测、Facebook/Twitter挖掘以及极端主义网络中动态社区检测方面的关键研究空白。
Online Radicalization (also called Cyber-Terrorism or Extremism or Cyber-Racism or Cyber- Hate) is widespread and has become a major and growing concern to the society, governments and law enforcement agencies around the world. Research shows that various platforms on the Internet (low barrier to publish content, allows anonymity, provides exposure to millions of users and a potential of a very quick and widespread diffusion of message) such as YouTube (a popular video sharing website), Twitter (an online micro-blogging service), Facebook (a popular social networking website), online discussion forums and blogosphere are being misused for malicious intent. Such platforms are being used to form hate groups, racist communities, spread extremist agenda, incite anger or violence, promote radicalization, recruit members and create virtual organi- zations and communities. Automatic detection of online radicalization is a technically challenging problem because of the vast amount of the data, unstructured and noisy user-generated content, dynamically changing content and adversary behavior. There are several solutions proposed in the literature aiming to combat and counter cyber-hate and cyber-extremism. In this survey, we review solutions to detect and analyze online radicalization. We review 40 papers published at 12 venues from June 2003 to November 2011. We present a novel classification scheme to classify these papers. We analyze these techniques, perform trend analysis, discuss limitations of existing techniques and find out research gaps.
研究动机与目标
- 系统性回顾并分类2003年至2011年期间关于在线极端化自动化检测与分析的现有研究。
- 识别由于非结构化、嘈杂且动态的用户生成内容,检测仇恨、极端主义和网络恐怖主义内容所面临的技术挑战。
- 提出一种新颖的多层级分类框架,基于技术、模态、数据类型、特征、评估和输出对文献进行组织。
- 分析检测与分析方法的趋势,包括基于内容、基于链接和基于网络的方法。
- 识别在基于活动的检测、未充分探索的模态(如Twitter、Facebook)以及极端主义网络中动态社区检测方面的未解决研究空白。
提出的方法
- 对2003年6月至2011年11月间发表于12个期刊的40篇论文进行了系统性文献回顾。
- 开发了一种新颖的多层级分类法,涵盖两个主要领域:在线极端化检测与在线极端化分析,共15个维度。
- 基于8个检测维度(如技术、模态、数据类型、特征、评估、输出、语言、体裁)和6个分析维度(如分析类型、基于网络/内容、模态、语言、体裁)对论文进行分类。
- 通过引用频率和时间线可视化进行趋势分析,以识别主导的研究方向及其随时间的变化。
- 通过对比分析评估现有技术,重点关注基于内容、基于链接和基于网络方法的优势与局限性。
- 通过分析活动特征、Facebook挖掘以及将正式社区检测算法应用于极端主义网络等未充分探索的领域,识别研究空白。
实验结果
研究问题
- RQ12003年至2011年间,在线极端化自动化检测中广泛使用的技术、模态和数据类型是什么?
- RQ2基于内容、基于链接和基于网络的方法在检测极端主义内容方面的有效性与局限性有何不同?
- RQ3正式社区检测算法在极端主义网络中的应用程度如何?为何这一领域仍属研究空白?
- RQ4鉴于在线内容具有动态性、匿名性和多模态特性,检测极端化面临哪些关键技术挑战?
- RQ5在自动化极端化检测背景下,哪些社交媒体平台(如Twitter、Facebook)仍属研究不足?
主要发现
- 基于内容和基于链接的特征是检测鼓吹仇恨内容最广泛使用的信号,而基于活动的特征则基本未被探索。
- 对极端主义社区的基于网络的分析主要通过图形布局的视觉检查进行,缺乏对社区检测算法的正式应用。
- 尽管微博客平台(如Twitter)以及图片分享或社交网络平台(如Facebook)在极端化传播方面具有高度潜力,但相关研究仍属不足。
- 仅有少数研究将正式的社区检测算法应用于极端主义网络,尽管这些算法在其他领域已被证明有效且可得。
- 文献显示对YouTube和博客圈的关注度很高,但对Twitter等实时、动态平台的关注度极低。
- 趋势分析显示,社会网络分析和机器学习技术的兴趣持续上升,但在可扩展、自动化和动态检测系统方面进展有限。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。