QUICK REVIEW

[論文レビュー] Efficient feature learning and multi-size image steganalysis based on CNN

Ru Zhang, Feng Zhu|arXiv (Cornell University)|Jul 30, 2018

Advanced Steganography and Watermarking Techniques参考文献 34被引用数 29

ひとこと要約

本稿では、特徴抽出の向上と複数サイズの画像検出を可能にするCNNベースのステガノグラフィー解析フレームワーク、Zhu-Netを提案する。3×3の小さなカーネル、信号対雑音比の向上を目的とした分離畳み込み、および任意サイズの画像との互換性を実現する空間的ピラミッドプーリングを用いることで、複数のデータセットにおいてWOWおよびS-UNIWARDのステガノグラフィーに対して最先端の検出精度を達成した。

ABSTRACT

For steganalysis, many studies showed that convolutional neural network has better performances than the two-part structure of traditional machine learning methods. However, there are still two problems to be resolved: cutting down signal to noise ratio of the steganalysis feature map and steganalyzing images of arbitrary size. Some algorithms required fixed size images as the input and had low accuracy due to the underutilization of the noise residuals obtained by various types of filters. In this paper, we focus on designing an improved network structure based on CNN to resolve the above problems. First, we use 3x3 kernels instead of the traditional 5x5 kernels and optimize convolution kernels in the preprocessing layer. The smaller convolution kernels are used to reduce the number of parameters and model the features in a small local region. Next, we use separable convolutions to utilize channel correlation of the residuals, compress the image content and increase the signal-to-noise ratio (between the stego signal and the image signal). Then, we use spatial pyramid pooling (SPP) to aggregate the local features, enhance the representation ability of features, and steganalyze arbitrary size image. Finally, data augmentation is adopted to further improve network performance. The experimental results show that the proposed CNN structure is significantly better than other four methods such as SRM, Ye-Net, Xu-Net, and Yedroudj-Net, when it is used to detect two spatial algorithms such as WOW and S-UNIWARAD with a wide variety of datasets and payloads.

研究の動機と目的

畳み込みカーネル設計の最適化により、ステガノグラフィー特徴マップにおける低信号対雑音比を是正すること。
分離畳み込みを用いてチャネルおよび空間的相関を活用することで、特徴表現を向上させること。
空間的ピラミッドプーリング（SPP）を用いて、任意サイズの画像に対する正確なステガノグラフィー解析を可能とすること。
広範なデータ拡張により、モデルの汎化性能を向上させ、過学習を低減すること。
空間ドメインのステガノグラフィーに対して、既存のCNNベースのステガノグラフィー解析器と比較して優れた検出性能を達成すること。

提案手法

特徴抽出の局所的モデリングを向上させるために、前処理層における従来の5×5畳み込みカーネルをより小さな3×3カーネルに置き換えることで、パラメータ数を削減する。
最初の畳み込み層に30個のSRMフィルタを初期化し、学習中に微調整することで、残差特徴抽出を強化する。
残差内に存在する空間的およびチャネルワイドな相関をモデル化するため、2つの分離畳み込みブロックを導入し、信号対雑音比を向上させる。
グローバル平均プーリングを空間的ピラミッドプーリング（SPP）モジュールに置き換えることで、複数レベルの特徴抽出を可能とし、任意の入力画像サイズをサポートする。
ラベルを保持する反転および回転を用いたデータ拡張を適用することで、トレーニングデータの多様性を高め、過学習を低減する。
スケーラビリティと性能向上の評価を目的として、段階的に大きなデータセット（BOSS、BOSS+BOWS2、BOSS+BOWS2+DA）でネットワークを訓練する。

実験結果

リサーチクエスチョン

RQ1より小さな畳み込みカーネルと最適化された初期化は、ステガノグラフィー解析における特徴抽出の効率性と検出精度を向上させ得るか？
RQ2分離畳み込みが、ステガノグラフィー特徴における残差相関をモデル化することによって、信号対雑音比をどの程度向上させるか？
RQ3空間的ピラミッドプーリングは、精度損ないやない状態で、任意サイズの画像に対するステガノグラフィー解析を効果的に可能にするか？
RQ4データ拡張は、CNNベースのステガノグラフィー解析におけるモデルの汎化性能と過学習にどのような影響を及ぼすか？
RQ5提案されたネットワークアーキテクチャは、複数のステガノグラフィーアルゴリズムおよびパケット量において、既存のCNNベースのステガノグラフィー解析器を上回る性能を示すか？

主な発見

BOSS+BOWS2+DAデータセットで学習した場合、Zhu-NetはWOW（0.2 bpp）に対して10.2%、S-UNIWARDに対して11.4%の誤検出率低下を達成し、Ye-NetおよびYedroudj-Netを上回った。
BOSSトレーニングセットのみを用いた場合、Zhu-NetはWOWで5.5%、S-UNIWARDで3.6%の誤検出率低下を達成し、ベースラインモデルを上回った。
分離畳み込みの導入により、残差内に存在する空間的およびチャネルワイドな相関を効果的に捉えることができ、信号対雑音比が顕著に向上した。
空間的ピラミッドプーリングにより、可変サイズの特徴マップを固定長の表現にマッピングすることで、任意サイズの画像に対する正確なステガノグラフィー解析が可能になった。
反転および回転を用いたデータ拡張により、過学習が低減され、汎化性能が向上した。すべてのテスト対象ステガノグラフィーアルゴリズムで性能向上が観察された。
Zhu-Netは、複数のデータセットおよびパケット量において、最先端の検出精度を達成し、SRMのような高度な手動特徴セットでさえも上回った。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。