Skip to main content
QUICK REVIEW

[論文レビュー] A Review of Machine Learning Applications in Fuzzing

Gary Saavedra, Kathryn Rodhouse|arXiv (Cornell University)|Jun 13, 2019
Face and Expression Recognition参考文献 55被引用数 33
ひとこと要約

本論文は機械学習がファジングにどのように適用されてきたかを調査し、MLが入力生成およびファジング後のタスクを改善する箇所を詳述し、課題と今後の方向性を概説します。

ABSTRACT

Fuzzing has played an important role in improving software development and testing over the course of several decades. Recent research in fuzzing has focused on applications of machine learning (ML), offering useful tools to overcome challenges in the fuzzing process. This review surveys the current research in applying ML to fuzzing. Specifically, this review discusses successful applications of ML to fuzzing, briefly explores challenges encountered, and motivates future research to address fuzzing bottlenecks.

研究の動機と目的

  • 脆弱性評価に焦点を当てて、ML技術がファジングにどのように適用されているかを要約する。
  • 入力生成およびファジング後のタスクにおいて最も効果的であるML手法(教師あり、教師なし、強化学習)を特定する。
  • MLとファジングの統合における課題を強調し、今後の研究の方向性を提案する。

提案手法

  • 入力生成およびファジング後のタスクにわたるファジングへのML応用に関する既存文献をレビューする。
  • 学習タイプ(教師あり、教師なし、強化学習)とファジング段階別にML技術を分類する。
  • MLベースの入力生成と組み合わせた記号実行の役割について論じる。
  • 可能な限り、ファジングツールを評価し、ML対応ファジングツールを比較するためのフレームワークを提示する。

実験結果

リサーチクエスチョン

  • RQ1ファジングにおける入力生成に適用されたML手法は何で、コードカバレッジやパス探索にどのような影響を与えたか。
  • RQ2クラッシュのトリアージや原因解析など、ファジング後のタスクにおいてML手法はどのように用いられてきたか。
  • RQ3MLをファジングに適用する際の主な課題は何か(例:学習コスト、フォーマット依存性、RLにおける報酬設計など)
  • RQ4MLを用いる際のファジングのボトルネックに対処する将来の研究方向は何か。

主な発見

  • 教師なし学習、特に遺伝的アルゴリズム、および深層学習は、ファジングツールにおける入力生成の可能性を示している。
  • DLアプローチは一部のフォーマット(例:PDF、ELF、XML、PNG)でコードカバレッジを向上させることができるが、結果はフォーマット依存であり必ずしも普遍的に優れているわけではない。
  • 入力生成に対する強化学習が検討されており、報酬設計とプログラム表現が重要な要因として特定されている。
  • 記号実行は入力生成を補完してカバレッジを改善する可能性があるが、計算コストが高く、完璧ではない。
  • ファジング後のMLアプリケーションは主に、教師ありまたは教師なしの手法を用いたクラッシュのトリアージと原因分類に焦点を当てている。
  • 顕著なギャップがあり、入力最小化およびコーパス minimization に関するML研究が不足している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。