[論文レビュー] Machine Learning in Digital Forensics: A Systematic Literature Review
この論文は2010年〜2021年のデジタル・フォレンジクスにおける機械学習の利用を系統的にレビューし、CNNベースの深層学習が画像フォレンジクスを支配していること、分野が著しく成長し主要研究が608件であることを示しています。
Development and exploitation of technology have led to the further expansion and complexity of digital crimes. On the other hand, the growing volume of data and, subsequently, evidence is a severe challenge in digital forensics. In recent years, the application of machine learning techniques to identify and analyze evidence has been on the rise in different digital forensics domains. This paper offers a systematic literature review of the research published in major academic databases from January 2010 to December 2021 on the application of machine learning in digital forensics, which was not presented yet to the best of our knowledge as comprehensive as this. The review also identifies the domains of digital forensics and machine learning methods that have received the most attention in the previous papers and finally introduces remaining research gaps. Our findings demonstrate that image forensics has obtained the greatest benefit from using machine learning methods, compared to other forensic domains. Moreover, CNN-based models are the most important machine learning methods that are increasingly being used in digital forensics. We present a comprehensive mind map to provide a proper perspective for valuable analytical results. Furthermore, visual analysis has been conducted based on the keywords of the papers, providing different thematic relevance topics. This research will give digital forensics investigators, machine learning developers, security researchers, and enthusiasts a broad view of the application of machine learning in digital forensics.
研究の動機と目的
- デジタル・フォレンジクスにおけるML応用が時間とともにどのように進化してきたかを特定する。
- ML-for-DF研究の地理的分布を特定する。
- ML in DF研究をホストする出版媒体とデータベースを調査する。
- 共通して使用されるキーワードとトピックを分析し、テーマ的傾向をマッピングする。
- ML手法とDF領域でML応用の影響を最も受けている領域を特定する。
提案手法
- KitchenhamとChartersのガイドラインに従った構造化された系統的文献レビューを実施する。
- 指定されたMLとDFキーワードでACM DL、IEEE Xplore、ScienceDirect、SpringerLinkを検索する。
- 包含・除外基準を適用する(査読付き、DFにおける実証的ML、2010–2021)。
- 前向き・後向きスノーボール法を用いて608件の一次研究に到達する。
- 含まれた研究からコンテキスト、定性的データ、定量データを抽出して分析する。
- マインドマップとキーワードネットワーク分析を作成し、ML手法とDF領域間の関係を要約する。

実験結果
リサーチクエスチョン
- RQ1RQ1: 2010年から2021年までにML-for-DFの公表は年次でどのように広がっているか?
- RQ2RQ2: 第一著者の国別でML-for-DF研究は地理的にどう分布しているか?
- RQ3RQ3: ML in digital forensicsの最も人気のある公表媒体とデータベースは何か?
- RQ4RQ4: 最も一般的に使用されるキーワードは何で、研究間でどのように related しているか?
- RQ5RQ5: デジタル・フォレンジクスで使用されているML手法は何で、どのDF領域で使われているか?
主な発見
- 合計で608件の一次研究が2021年12月までに特定された。
- 2016年以降、公表活動が急増し、DFにおけるMLが大きな注目を集めた。
- 中国、インド、USAが主要な寄与国であり、ヨーロッパは約18%を占める。
- 会議会場が公表アウトプットを支配し、Elsevierジャーナルはジャornal論文の約47%を占める。
- 画像フォレンジクスが最も調査されたDF領域であり(おおむそ62%)、CNNベースと深層学習手法が最も頻繁に用いられるML技術で、特に画像フォレンジクスでCNN関連用語がキーワードに多く見られる。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。