QUICK REVIEW

[論文レビュー] Adversarial Examples on Discrete Sequences for Beating Whole-Binary Malware Detection.

Felix Kreuk, Assi Barak|arXiv (Cornell University)|Feb 13, 2018

Adversarial Robustness in Machine Learning参考文献 13被引用数 45

ひとこと要約

この論文は、悪意あるバイナリに慎重に設計されたバイトシーケンスを追加することで、完全なバイナリマルウェア検出器に対する新たな敵対的攻撃を提案している。この攻撃により、機能を保持したまま高い信頼性で検出を回避できる。本手法はCNNベースのモデルを活用し、バイナリファイル内の離散的シーケンスの操作によって、ほぼ完璧な回避率を達成する。

ABSTRACT

In recent years, deep learning has shown performance breakthroughs in many applications, such as image detection, image segmentation, pose estimation, and speech recognition. It was also applied successfully to malware detection. However, this comes with a major concern: deep networks have been found to be vulnerable to adversarial examples. So far successful attacks have been proved to be very effective especially in the domains of images and speech, where small perturbations to the input signal do not change how it is perceived by humans but greatly affect the classification of the model under attack. Our goal is to modify a malicious binary so it would be detected as benign while preserving its original functionality. In contrast to images or speech, small modifications to bytes of the binary lead to significant changes in the functionality. We introduce a novel approach to generating adversarial example for attacking a whole-binary malware detector. We append to the binary file a small section, which contains a selected sequence of bytes that steers the prediction of the network from malicious to be benign with high confidence. We applied this approach to a CNN-based malware detection model and showed extremely high rates of success in the attack.

研究の動機と目的

深層学習に基づく完全なバイナリマルウェア検出器が敵対的例に対して脆弱であるという問題に取り組む。
悪意あるバイナリを変更する手法を開発し、その機能を保持しながら検出を回避できるようにする。
従来の画像や音声ベースの攻撃とは異なり、バイナリファイルの離散ドメインで敵対的例を生成する。
最小限の標的的変更により、悪意あるバイナリを高信頼性で良性と誤分類させる。

提案手法

攻撃は、悪意あるバイナリファイルの末尾に短く最適化されたバイトシーケンスを追加する。
追加されるバイトシーケンスは、CNNベースのマルウェア検出器の予測を「良性」分類へと導くように生成される。
本手法はバイナリを離散的シーケンスとして扱い、シーケンスベースの敵対的生成技術を活用できる。
攻撃は、変更後のバイナリが元の悪意ある機能を保持しなければならないという制約のもとで動作する。
最小限のバイトシーケンスが誤分類を引き起こすように、勾配に基づく最適化に依存する。
攻撃は、訓練済みのCNNベースのマルウェア検出モデル上で評価され、高い回避成功率を示した。

実験結果

リサーチクエスチョン

RQ1バイナリファイルの離散的空間において、完全なバイナリマルウェア検出器を回避できる敵対的例を効果的に生成できるか？
RQ2提案手法は、CNNベースのマルウェア検出器が悪意あるバイナリを良性と誤分類させるのにどの程度有効か？
RQ3敵対的変更後、元の悪意あるバイナリの機能はどの程度保持されるか？
RQ4高信頼性での回避を達成するために必要な敵対的バイトシーケンスの最小長は何か？

主な発見

提案手法は、CNNベースの完全なバイナリマルウェア検出モデルに対する回避成功率が極めて高いことを達成した。
攻撃は、モデルが悪意あるバイナリを高信頼性で良性と分類させるのを成功させた。
変更はわずかなバイトシーケンスの追加にとどまり、バイナリのサイズや構造への影響は最小限に抑えられた。
敵対的変換後も、悪意あるバイナリの元の機能が保持された。
本攻撃は、バイナリファイルの離散ドメインで効果的な敵対的例を生成する可能性を示した。
結果は、完全なバイナリ分析を用いた深層学習ベースのマルウェア検出システムにおける深刻な脆弱性を浮き彫りにした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。