[論文レビュー] Solutions to Detect and Analyze Online Radicalization : A Survey
本調査は、2003年から2011年までの40篇の論文を対象とし、Twitter、Facebook、YouTubeなどのソーシャルメディア・プラットフォームにおけるオンラインの過激化の自動検出および分析についてレビューしている。本調査では、モダリティ、特徴タイプ、評価、分析手法に基づいて技術を分類するための新規のマルチレベル分類法を提案し、活動ベースの検出、Facebook/Twitterのマイニング、過激主義的ネットワークにおける動的コミュニティ検出の分野における研究ギャップを特定した。
Online Radicalization (also called Cyber-Terrorism or Extremism or Cyber-Racism or Cyber- Hate) is widespread and has become a major and growing concern to the society, governments and law enforcement agencies around the world. Research shows that various platforms on the Internet (low barrier to publish content, allows anonymity, provides exposure to millions of users and a potential of a very quick and widespread diffusion of message) such as YouTube (a popular video sharing website), Twitter (an online micro-blogging service), Facebook (a popular social networking website), online discussion forums and blogosphere are being misused for malicious intent. Such platforms are being used to form hate groups, racist communities, spread extremist agenda, incite anger or violence, promote radicalization, recruit members and create virtual organi- zations and communities. Automatic detection of online radicalization is a technically challenging problem because of the vast amount of the data, unstructured and noisy user-generated content, dynamically changing content and adversary behavior. There are several solutions proposed in the literature aiming to combat and counter cyber-hate and cyber-extremism. In this survey, we review solutions to detect and analyze online radicalization. We review 40 papers published at 12 venues from June 2003 to November 2011. We present a novel classification scheme to classify these papers. We analyze these techniques, perform trend analysis, discuss limitations of existing techniques and find out research gaps.
研究の動機と目的
- 2003年から2011年までの期間にわたり、オンラインの過激化の自動検出および分析に関する既存研究を体系的にレビューし、分類すること。
- 構造的でない、ノイズが多く、動的なユーザー生成コンテンツのため、憎悪、過激主義、サイバー・テロリズム関連コンテンツを検出するうえでの技術的課題を特定すること。
- 技術、モダリティ、データタイプ、特徴、評価、出力に基づいて文献を整理するための新規のマルチレベル分類フレームワークを提案すること。
- コンテンツベース、リンクベース、ネットワークベースのアプローチを含む検出および分析手法のトレンドを分析すること。
- 活動ベースの検出、未開拓のモダリティ(例:Twitter、Facebook)、過激主義的ネットワークにおける動的コミュニティ検出の分野における未解決の研究ギャップを特定すること。
提案手法
- 2003年6月から2011年11月までの間に発表された12の学術会議で採択された40篇の論文を対象とした体系的文献レビューを実施した。
- オンラインの過激化検出とオンラインの過激化分析の2つの主要ドメインをカバーする15の側面を有する新規のマルチレベル分類法を開発した。
- 検出分野では8つの側面(例:技術、モダリティ、データタイプ、特徴、評価、出力、言語、ジャンル)と、分析分野では6つの側面(例:分析タイプ、ネットワーク/コンテンツベース、モダリティ、言語、ジャンル)に基づいて論文を分類した。
- 引用頻度とタイムライン可視化を用いたトレンド分析により、研究の主な方向性と時間的変化を特定した。
- コンテンツベース、リンクベース、ネットワークベースのアプローチの強みと限界に焦点を当てた比較分析を通じて、既存技術の評価を実施した。
- 活動ベースの特徴、Facebookのマイニング、過激主義的ネットワークへの形式的コミュニティ検出アルゴリズムの適用といった未開拓分野を分析することで、研究ギャップを同定した。
実験結果
リサーチクエスチョン
- RQ12003年から2011年までの間、オンラインの過激化の自動検出に用いられた主な技術、モダリティ、データタイプは何か?
- RQ2コンテンツベース、リンクベース、ネットワークベースのアプローチは、過激主義的コンテンツ検出において、それぞれどのように効果的で、どのような制限を有するか?
- RQ3形式的コミュニティ検出アルゴリズムは、過激主義的ネットワークに対してどの程度適用されており、なぜこの分野は未開拓とされているのか?
- RQ4オンラインコンテンツの動的で匿名的かつマルチモーダルな性質を考慮すると、過激化検出における主な技術的課題は何か?
- RQ5Twitterなどのようなリアルタイムで変化するプラットフォーム(例:Twitter、Facebook)は、自動過激化検出の文脈でどの程度未研究のままであるか?
主な発見
- 憎悪を助長するコンテンツを検出するための主な信号として、コンテンツベースおよびリンクベースの特徴が広く用いられているが、活動ベースの特徴はほとんど未開拓のままである。
- 過激主義的コミュニティのネットワークベース分析は、主にグラフレイアウトの視覚的検査に依存しており、形式的なコミュニティ検出アルゴリズムの適用が不足している。
- Twitterのようなマイクロブログプラットフォーム、および写真共有やソーシャルネットワーキングサイト(Facebookなど)は、過激化の拡散の可能性が非常に高いにもかかわらず、未だに研究が不足している。
- 過激主義的ネットワークへの形式的コミュニティ検出アルゴリズムの適用は、わずかにしかなされておらず、その有効性は他の分野で実証済みであるにもかかわらず、未だに低水準にとどまっている。
- 文献はYouTubeやブログの世界に強く注目しているが、リアルタイムで変化するTwitterのようなプラットフォームにはほとんど注目が向けられていない。
- トレンド分析により、社会的ネットワーク分析や機械学習技術への関心が高まっていることが明らかになったが、スケーラブルで自動的かつ動的検出システムの分野では、進展が限定的であることが判明した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。