QUICK REVIEW

[论文解读] A Review of Machine Learning Applications in Fuzzing

Gary Saavedra, Kathryn Rodhouse|arXiv (Cornell University)|Jun 13, 2019

Face and Expression Recognition参考文献 55被引用 33

一句话总结

这篇论文综述了机器学习在模糊测试中的应用，详细描述了 ML 在输入生成和后模糊任务中的改进之处，并概述了挑战与未来方向。

ABSTRACT

Fuzzing has played an important role in improving software development and testing over the course of several decades. Recent research in fuzzing has focused on applications of machine learning (ML), offering useful tools to overcome challenges in the fuzzing process. This review surveys the current research in applying ML to fuzzing. Specifically, this review discusses successful applications of ML to fuzzing, briefly explores challenges encountered, and motivates future research to address fuzzing bottlenecks.

研究动机与目标

总结 ML 技术在模糊测试中的应用，聚焦于脆弱性评估。
确定哪些 ML 方法（有监督、无监督、强化学习）在输入生成和后模糊任务中最有效。
着重在将 ML 与模糊测试整合方面的挑战，并提出未来研究方向。

提出的方法

回顾现有文献，关于 ML 在模糊测试中在输入生成和后模糊任务的应用。
按学习类型（有监督、无监督、强化学习）及模糊测试阶段对 ML 技术进行分类。
讨论符号执行在与基于 ML 的输入生成结合中的作用。
提出一个评估模糊测试工具的框架，并在可能的情况下比较支持 ML 的模糊测试工具。

实验结果

研究问题

RQ1在模糊测试中应用了哪些 ML 技术来生成输入，对代码覆盖率或路径探索有何影响？
RQ2ML 方法如何在后模糊任务（如崩溃分诊和根因分析）中使用？
RQ3将 ML 应用于模糊测试的主要挑战是什么（例如，训练成本、格式依赖、强化学习中的奖励定义）？
RQ4在使用 ML 时，哪些未来研究方向可以解决模糊测试中的瓶颈？

主要发现

无监督学习，特别是遗传算法，以及深度学习，在输入生成方面展示出潜力。
DL 方法可改善某些格式的代码覆盖率（例如 PDF、ELF、XML、PNG），但结果取决于格式，并非普遍优越。
强化学习已被用于输入生成，奖励设计和程序表示被认为是关键因素。
符号执行可以增强输入生成以提升覆盖，但仍然计算成本高且不完美。
后模糊任务中的 ML 应用主要聚焦于崩溃分诊和根因分类，使用有监督或无监督方法。
仍存在显著的空白领域，包括缺乏关于输入最小化和语料库最小化的 ML 工作。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。