Skip to main content
QUICK REVIEW

[論文レビュー] Applying Social Media Intelligence for Predicting and Identifying On-line Radicalization and Civil Unrest Oriented Threats

Swati Agarwal, Ashish Sureka|arXiv (Cornell University)|Nov 21, 2015
Hate Speech and Cyberbullying Detection参考文献 76被引用数 47
ひとこと要約

本稿は、オンラインの過激化および市民的動乱の脅威を検出するためのソーシャルメディアインテリジェンスに関する100件以上の研究を網羅的にレビューし、自然言語処理(NLP)、機械学習、社会的ネットワーク分析などの技術を分析している。TwitterとYouTubeが過激化および抗議活動の動員に主に使われるプラットフォームであることが特定され、クラスタリング、ロジスティック回帰、名前付きエンティティ認識(NER)が主な手法であると判明した。多言語および地域特化型の脅威検出における顕著な研究ギャップが浮き彫りにされた。

ABSTRACT

Research shows that various social media platforms on Internet such as Twitter, Tumblr (micro-blogging websites), Facebook (a popular social networking website), YouTube (largest video sharing and hosting website), Blogs and discussion forums are being misused by extremist groups for spreading their beliefs and ideologies, promoting radicalization, recruiting members and creating online virtual communities sharing a common agenda. Popular microblogging websites such as Twitter are being used as a real-time platform for information sharing and communication during planning and mobilization if civil unrest related events. Applying social media intelligence for predicting and identifying online radicalization and civil unrest oriented threats is an area that has attracted several researchers' attention over past 10 years. There are several algorithms, techniques and tools that have been proposed in existing literature to counter and combat cyber-extremism and predicting protest related events in much advance. In this paper, we conduct a literature review of all these existing techniques and do a comprehensive analysis to understand state-of-the-art, trends and research gaps. We present a one class classification approach to collect scholarly articles targeting the topics and subtopics of our research scope. We perform characterization, classification and an in-depth meta analysis meta-anlaysis of about 100 conference and journal papers to gain a better understanding of existing literature.

研究の動機と目的

  • オンライン過激化および市民的動乱の脅威を検出するためのソーシャルメディアインテリジェンス分野における最新の状況を分析すること。
  • 現在の研究において用いられている主な技術、プラットフォーム、特徴量を特定すること。
  • 多言語コンテンツ分析、地域特化性、評価手法論における研究ギャップを明らかにすること。
  • 機械学習およびNLP手法が極端主義コンテンツの検出および動乱イベントの予測にどの程度効果的であるかを評価すること。
  • 100件以上の学術論文のメタアナリシスを提供し、知的・セキュリティインフォーマティクス分野における今後の研究を支援すること。

提案手法

  • オンライン過激化および市民的動乱検出に焦点を当てた学術論文の収集とフィルタリングのための一クラス分類アプローチを実施した。
  • ISIおよびSIの会議およびジャーナル論文100件を対象に、特徴の特定、分類、およびメタアナリシスを実施した。
  • クラスタリング、ロジスティック回帰、動的クエリ拡張、名前付きエンティティ認識(NER)を含む主な技術を特定および分類した。
  • 空間的・時間的メタデータ、文脈的メタデータ、ユーザープロフィール特徴量(例:アクティビティフィード、人口統計データ)を用いた脅威検出の分析を行った。
  • グラフモデリングおよび社会的ネットワーク分析(SNA)が、隠れた過激主義コミュニティの同定に果たす役割を評価した。
  • 精度、F1スコア、コミュニティ検出のパフォーマンスといった評価手法を、複数の研究において評価した。

実験結果

リサーチクエスチョン

  • RQ1ソーシャルメディア上でのオンライン過激化および市民的動乱の検出に、最も一般的に使われている技術とプラットフォームは何か?
  • RQ2機械学習およびNLP手法は、極端主義コンテンツの同定および抗議イベントの予測にどの程度効果的か?
  • RQ3空間的・時間的、言語的、ネットワークベースのメタデータおよび特徴量(例:空間的・時間的、言語的、ネットワークベース)の中で、過激化または動乱を予測するのに最も予測的であるのはどれか?
  • RQ4既存の研究は、多言語または英語圏以外の文脈において、どの程度の地域的・言語的範囲をカバーしているか?
  • RQ5現在のアプローチにおいて、特に地域特化性および評価の厳密性に欠ける主要な研究ギャップは何か?

主な発見

  • Twitterは、リアルタイム性と短文性、フォロワー基盤の拡散性のおかげで、市民的動乱予測に最も広く使われているプラットフォームである。
  • YouTubeは、過激化の主なプラットフォームであるが、抗議予測研究においてはあまり活用されていない。
  • 名前付きエンティティ認識(NER)は、過激化および動乱検出の両方のテキスト処理パイプラインで一般的に使われるコンponentである。
  • 90%の研究が英語コンテンツに焦点を当てており、多言語および英語以外のテキスト分析における顕著なギャップが示された。
  • 60%の研究が特定の国または地域の出来事に焦点を当てており、その大部分がラテンアメリカおよびアメリカ合衆国に集中している。
  • 精度が最も一般的に使われる評価指標であり、社会的ネットワーク分析(SNA)は、隠れた過激主義コミュニティの検出に頻繁に応用されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。