QUICK REVIEW

[논문 리뷰] Imbalanced Malware Images Classification: a CNN based Approach

Songqing Yue, Wang, Tianyang|arXiv (Cornell University)|2017. 08. 27.

Advanced Malware Detection Techniques참고 문헌 13인용 수 108

한 줄 요약

이 논문은 악성코드 이미지 분류에서 클래스 불균형을 다루기 위해 가중 소프트맥스 손실을 제안하고, VGG-19를 세밀 조정(fine-tuning)하고 여러 CNN에서의 유효성을 검증하여 효과를 입증한다.

ABSTRACT

Deep convolutional neural networks (CNNs) can be applied to malware binary detection via image classification. The performance, however, is degraded due to the imbalance of malware families (classes). To mitigate this issue, we propose a simple yet effective weighted softmax loss which can be employed as the final layer of deep CNNs. The original softmax loss is weighted, and the weight value can be determined according to class size. A scaling parameter is also included in computing the weight. Proper selection of this parameter is studied and an empirical option is suggested. The weighted loss aims at alleviating the impact of data imbalance in an end-to-end learning fashion. To validate the efficacy, we deploy the proposed weighted loss in a pre-trained deep CNN model and fine-tune it to achieve promising results on malware images classification. Extensive experiments also demonstrate that the new loss function can well fit other typical CNNs, yielding an improved classification performance.

연구 동기 및 목표

CNN 기반 분류에서 매우 불균형한 악성코드 이미지 데이터 세트의 문제를 해결한다.
학습 균형화를 위해 클래스 크기에 의존하는 가중치를 가진 가중 소프트맥스 손실을 도입한다.
사전 학습된 CNN(VGG-19)을 미세 조정하고 여러 모델에서 이를 검증하는 방식으로 접근을 demonstrated한다.

제안 방법

가중 소프트맥스 손실 J0 = -(1/m) sum_i sum_j w_k 1(y(i)=j) log p_j^(i).
가중치 w_k = 1 + (S_max - S_k) / (beta * S_max) 로 계산하며, beta는 스케일링을 제어한다(경험적으로 beta=20).
드롭아웃과 배치 정규화 레이어가 추가된 사전 학습된 VGG-19 모델을 미세 조정; 가중 손실을 최종 레이어로 추가한다.
25클래스 불균형 악성코드 이미지 데이터셋에서 Top-1 검증 오류를 사용하여 평가하고, 가중 손실 유무를 여러 VGG 변형 간에 비교한다.
MatConvNet을 Nvidia TITAN X에서 사용하고, 추가 레이어를 포함한 60-레이어 최종 구조를 갖춘다

실험 결과

연구 질문

RQ1클래스 불균형에 민감한 손실이 불균형한 악성코드 이미지 데이터셋에서 CNN 성능을 향상시킬 수 있는가?
RQ2제안된 가중 소프트맥스 손실이 실험 모델을 넘어 다양한 CNN 아키텍처에서도 일반화되는가?
RQ3스케일링 매개변수 beta가 학습 안정성과 정확도에 어떤 영향을 미치는가?
RQ4가중 손실로 사전 학습된 CNN을 미세 조정하는 것이 원래 손실을 사용하는 것과 비교해 어떤 차이가 있는가?
RQ5가중 손실에서 특징 표현에Qualitative한 변화가 나타나는가?

주요 결과

가중 소프트맥스 손실은 모델 전반에 걸쳐 Top-1 정확도를 향상시킨다(예: VGG-19에서 97.32%에서 98.63%로 증가).
VGG-19, VGG-F, VGG-M, VGG-S 등 VGG 계열에서 가중 손실은 원래 손실보다 테스트 정확도를 일관되게 향상시킨다.
가중 손실로 미세 조정된 VGG-19는 더 높은 검증 정확도와 더 안정적인 학습 곡선을 보인다.
Beta = 20은 다른 테스트 값들보다 수렴을 더 매끈하게 하고 최종 오차를 더 좋게 만든다.
특징 맵은 가중 손실 하에서 클래스-특이적인 구별 가능한 표현을 보여준다

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.