QUICK REVIEW

[논문 리뷰] Efficient feature learning and multi-size image steganalysis based on CNN

Ru Zhang, Feng Zhu|arXiv (Cornell University)|2018. 07. 30.

Advanced Steganography and Watermarking Techniques참고 문헌 34인용 수 29

한 줄 요약

이 논문은 특징 학습을 향상시키고 다중 크기 이미지 탐지 기능을 가능하게 하는 CNN 기반의 스테가노그래피 분석 프레임워크인 Zhu-Net을 제안한다. 더 작은 3×3 커널, 신호 대 잡음비를 향상시키기 위한 분리 가능 컨볼루션, 그리고 임의의 이미지 크기 호환성을 위한 공간 피라미드 풀링을 사용함으로써, 다양한 데이터셋에서 WOW 및 S-UNIWARD 스테가노그래피에 대해 최신 기술 수준의 탐지 정확도를 달성한다.

ABSTRACT

For steganalysis, many studies showed that convolutional neural network has better performances than the two-part structure of traditional machine learning methods. However, there are still two problems to be resolved: cutting down signal to noise ratio of the steganalysis feature map and steganalyzing images of arbitrary size. Some algorithms required fixed size images as the input and had low accuracy due to the underutilization of the noise residuals obtained by various types of filters. In this paper, we focus on designing an improved network structure based on CNN to resolve the above problems. First, we use 3x3 kernels instead of the traditional 5x5 kernels and optimize convolution kernels in the preprocessing layer. The smaller convolution kernels are used to reduce the number of parameters and model the features in a small local region. Next, we use separable convolutions to utilize channel correlation of the residuals, compress the image content and increase the signal-to-noise ratio (between the stego signal and the image signal). Then, we use spatial pyramid pooling (SPP) to aggregate the local features, enhance the representation ability of features, and steganalyze arbitrary size image. Finally, data augmentation is adopted to further improve network performance. The experimental results show that the proposed CNN structure is significantly better than other four methods such as SRM, Ye-Net, Xu-Net, and Yedroudj-Net, when it is used to detect two spatial algorithms such as WOW and S-UNIWARAD with a wide variety of datasets and payloads.

연구 동기 및 목표

스테가노그래피 특징 맵에서 낮은 신호 대 잡음비 문제를 해결하기 위해 컨볼루션 커널 설계를 최적화한다.
분리 가능 컨볼루션을 통해 채널 및 공간 상관관계를 활용하여 특징 표현을 향상시킨다.
공간 피라미드 풀링(SPP)을 사용하여 임의의 크기의 이미지에 대한 정확한 스테가노그래피 분석을 가능하게 한다.
광범위한 데이터 증강을 통해 모델 일반화 능력을 향상시키고 과적합을 줄인다.
공간 도메인 스테가노그래피에 대해 기존의 CNN 기반 스테가노그래피 분석기들보다 뛰어난 탐지 성능을 달성한다.

제안 방법

전처리 계층에서 기존의 5×5 컨볼루션 커널을 더 작은 3×3 커널로 대체하여 파rameter 수를 줄이고 국소적 특징 모델링 능력을 향상시킨다.
첫 번째 컨볼루션 계층에 30개의 SRM 필터를 초기화하고 학습 중에 미세조정하여 잔차 특징 추출 능력을 향상시킨다.
잔차 내의 공간적 및 채널별 상관관계를 모델링하기 위해 두 개의 분리 가능 컨볼루션 블록을 도입하여, 신호 대 잡음비를 증가시킨다.
전역 평균 풀링을 공간 피라미드 풀링(SPP) 모듈로 대체하여 다중 수준의 특징을 추출하고, 임의의 입력 이미지 크기 호환성을 확보한다.
라벨 유지형 플립 및 회전을 통한 데이터 증강을 적용하여 훈련 데이터의 다양성을 증가시키고 과적합을 줄인다.
진행적 데이터셋(BOSS, BOSS+BOWS2, BOSS+BOWS2+DA)을 사용해 네트워크를 훈련시켜 확장성과 성능 향상을 평가한다.

실험 결과

연구 질문

RQ1더 작은 컨볼루션 커널과 최적화된 초기화는 스테가노그래피 분석에서 특징 학습 효율성과 탐지 정확도 향상에 기여하는가?
RQ2분리 가능 컨볼루션은 스테가노그래피 특징 내 잔차 상관관계를 모델링함으로써 어느 정도의 신호 대 잡음비 향상을 이룰 수 있는가?
RQ3공간 피라미드 풀링은 정확도 손실 없이 임의의 크기의 이미지에 대한 스테가노그래피 분석을 효과적으로 가능하게 하는가?
RQ4데이터 증강은 CNN 기반 스테가노그래피 분석에서 모델 일반화 능력과 과적합에 어떤 영향을 미치는가?
RQ5제안된 네트워크 아키텍처는 여러 스테가노그래피 알고리즘과 패킷 크기에서 기존의 CNN 기반 스테가노그래피 분석기들을 능가하는가?

주요 결과

증강된 BOSS+BOWS2+DA 데이터셋으로 훈련했을 때, WOW에 대해 0.2 bpp에서 10.2% 감소한 탐지 오류율과 S-UNIWARD에 대해 11.4% 감소한 오류율을 기록하여 Ye-Net 및 Yedroudj-Net을 능가했다.
BOSS 훈련 세트만을 사용했을 때, WOW에 대해 5.5%의 오류율 감소와 S-UNIWARD에 대해 3.6%의 감소를 달성하여 기준 모델보다 향상된 성능을 보였다.
분리 가능 컨볼루션의 사용은 잔차 내 공간적 및 채널 상관관계를 효과적으로 파악함으로써 신호 대 잡음비를 크게 향상시켰다.
공간 피라미드 풀링은 가변 크기의 특징 맵을 고정 길이 표현으로 매핑함으로써 임의의 크기의 이미지에 대한 정확한 스테가노그래피 분석을 가능하게 하였다.
플립 및 회전을 통한 데이터 증강은 과적합을 감소시키고 일반화 능력을 향상시켰으며, 모든 테스트된 스테가노그래피 알고리즘에서 성능 향상을 관찰할 수 있었다.
Zhu-Net은 최신 기술 수준의 탐지 정확도를 달성하여, 여러 데이터셋과 패킷 크기에서 SRM과 같은 고도로 수작업된 특징 세트조차도 능가했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.