QUICK REVIEW

[논문 리뷰] A Review of Machine Learning Applications in Fuzzing

Gary Saavedra, Kathryn Rodhouse|arXiv (Cornell University)|2019. 06. 13.

Face and Expression Recognition참고 문헌 55인용 수 33

한 줄 요약

이 논문은 머신 러닝이 퍼징에 어떻게 적용되어 왔는지 조사하며 입력 생성 및 포스트-퍼징 작업에서 ML이 개선하는 위치를 상세히 설명하고 도전과제와 향후 방향을 제시한다.

ABSTRACT

Fuzzing has played an important role in improving software development and testing over the course of several decades. Recent research in fuzzing has focused on applications of machine learning (ML), offering useful tools to overcome challenges in the fuzzing process. This review surveys the current research in applying ML to fuzzing. Specifically, this review discusses successful applications of ML to fuzzing, briefly explores challenges encountered, and motivates future research to address fuzzing bottlenecks.

연구 동기 및 목표

취약점 평가에 초점을 맞춰 ML 기법이 퍼징에 어떻게 적용되었는지 요약한다.
입력 생성 및 포스트-퍼징 작업에서 가장 효과적이었던 ML 접근 방식(감독 학습, 비지도 학습, 강화 학습)을 식별한다.
ML과 퍼징의 통합에서의 도전과제를 강조하고 향후 연구 방향을 제시한다.

제안 방법

입력 생성 및 포스트-퍼징 작업 전반에 걸친 퍼징에서의 ML 응용에 관한 기존 문헌을 검토한다.
학습 유형(감독 학습, 비지도 학습, 강화 학습)과 퍼징 단계별로 ML 기법을 분류한다.
ML 기반 입력 생성을 보완하는 심볼릭 실행의 역할에 대해 논의한다.
가능한 경우 퍼저를 평가하고 ML-활성화된 퍼저를 비교하기 위한 프레임워크를 제시한다.

실험 결과

연구 질문

RQ1퍼징에서 입력 생성을 위해 어떤 ML 기법이 적용되었으며 코드 커버리지나 경로 탐색에 어떤 영향을 미쳤는가?
RQ2충돌 선별(crash triage) 및 근본 원인 분석과 같은 포스트-퍼징 작업에서 ML 방법이 어떻게 사용되었는가?
RQ3ML을 퍼징에 적용하는 데 있어 주요 도전과제는 무엇인가(예: 학습 비용, 포맷 의존성, 강화학습에서의 보상 정의 등)?
RQ4ML을 활용할 때 퍼징의 병목 현상을 해결할 수 있는 향후 연구 방향은 무엇인가?

주요 결과

비지도 학습, 특히 유전 알고리즘, 및 딥 러닝이 퍼저의 입력 생성에 유망함을 보여주었다.
딥 러닝 접근법은 일부 포맷(PDF, ELF, XML, PNG)에서 코드 커버리지를 향상시킬 수 있지만 결과는 포맷에 따라 다르며 보편적으로 우수하다고 할 수 없다.
강화 학습은 입력 생성을 위해 탐구되었으며 보상 설계와 프로그램 표현이 핵심 요인으로 지적되었다.
심볼릭 실행은 입력 생성을 보강하여 커버리지를 향상시킬 수 있지만 여전히 계산 비용이 많이 들고 불완전하다.
포스트-퍼징 ML 응용은 주로 감독 혹은 비지도 방법을 사용한 크래시 트리아지와 근본 원인 분류에 집중한다.
입력 최소화와 말뭉치 최소화에 대한 ML 연구의 부족 등 중요한 격차가 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.