QUICK REVIEW

[논문 리뷰] Adversarial Examples on Discrete Sequences for Beating Whole-Binary Malware Detection.

Felix Kreuk, Assi Barak|arXiv (Cornell University)|2018. 02. 13.

Adversarial Robustness in Machine Learning참고 문헌 13인용 수 45

한 줄 요약

이 논문은 악성 바이너리에 정교하게 설계된 바이트 시퀀스를 첨부하여 전체 바이너리 악성코드 검출기의 탐지를 피하는 새로운 적대적 공격을 제안한다. 이 공격은 기능을 유지하면서도 높은 신뢰도로 탐지 회피를 가능하게 하며, CNN 기반 모델을 활용하여 바이너리 파일 내 이산 시퀀스 조작을 통해 거의 완벽한 회피율을 달성한다.

ABSTRACT

In recent years, deep learning has shown performance breakthroughs in many applications, such as image detection, image segmentation, pose estimation, and speech recognition. It was also applied successfully to malware detection. However, this comes with a major concern: deep networks have been found to be vulnerable to adversarial examples. So far successful attacks have been proved to be very effective especially in the domains of images and speech, where small perturbations to the input signal do not change how it is perceived by humans but greatly affect the classification of the model under attack. Our goal is to modify a malicious binary so it would be detected as benign while preserving its original functionality. In contrast to images or speech, small modifications to bytes of the binary lead to significant changes in the functionality. We introduce a novel approach to generating adversarial example for attacking a whole-binary malware detector. We append to the binary file a small section, which contains a selected sequence of bytes that steers the prediction of the network from malicious to be benign with high confidence. We applied this approach to a CNN-based malware detection model and showed extremely high rates of success in the attack.

연구 동기 및 목표

딥 러닝 기반 전체 바이너리 악성코드 검출기의 적대적 예제에 대한 취약성을 해결하기 위해.
악성 바이너리를 수정하여 기능을 유지하면서도 탐지를 피할 수 있는 방법을 개발하기 위해.
기존의 이미지나 음성 기반 공격과 다름없이 바이너리 파일의 이산 도메인에서 적대적 예제를 생성하기 위해.
최소한의 타겟된 수정을 통해 악성 바이너리를 높은 신뢰도로 양성으로 오분류하기 위해.

제안 방법

공격은 악성 바이너리 파일 끝에 짧고 최적화된 바이트 시퀀스를 첨부한다.
첨부된 바이트 시퀀스는 CNN 기반 악성코드 검출기의 예측을 양성 분류 쪽으로 유도하도록 생성된다.
이 방법은 바이너리를 이산 시퀀스로 간주하여 시퀀스 기반 적대적 생성 기법을 적용할 수 있도록 한다.
수정된 바이너리가 원래의 악성 기능을 유지해야 한다는 제약 조건 하에서 작동한다.
최소한의 바이트 시퀀스가 오분류를 유도하도록 하기 위해 기울기 기반 최적화를 활용한다.
공격은 훈련된 CNN 기반 악성코드 탐지 모델을 대상으로 평가되어 높은 회피 성공률를 입증했다.

실험 결과

연구 질문

RQ1이산적인 바이너리 파일 도메인에서 효과적으로 전체 바이너리 악성코드 검출기를 회피할 수 있는 적대적 예제를 생성할 수 있는가?
RQ2제안된 방법이 CNN 기반 악성코드 검출기가 악성 바이너리를 양성으로 오분류하는 데 얼마나 효과적인가?
RQ3적대적 수정 이후 원래 악성 바이너리의 기능은 어느 정도 유지되는가?
RQ4높은 신뢰도의 회피를 달성하기 위해 필요한 최소 길이의 적대적 바이트 시퀀스는 얼마인가?

주요 결과

제안된 방법은 CNN 기반 전체 바이너리 악성코드 탐지 모델의 회피 성공률가 매우 높았다.
공격은 모델이 악성 바이너리를 높은 신뢰도로 양성으로 오분류하도록 성공적으로 유도했다.
수정은 오직 작은 바이트 시퀀스를 첨부하는 것으로 이루어져 바이너리의 크기와 구조에 미치는 영향이 최소한이었다.
적대적 변환 이후에도 악성 바이너리의 원래 기능이 그대로 유지되었다.
이산 도메인인 바이너리 파일에서 효과적인 적대적 예제를 생성할 수 있음을 입증했다.
결과는 전체 바이너리 분석을 사용하는 딥 러닝 기반 악성코드 탐지 시스템에 치명적인 취약점이 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.