QUICK REVIEW

[논문 리뷰] Application of DenseNet in Camera Model Identification and Post-processing Detection

Abdul Muntakim Rafi, Uday Kamal|arXiv (Cornell University)|2018. 09. 03.

Digital Media Forensic Detection참고 문헌 34인용 수 35

한 줄 요약

이 논문은 메타데이터가 없는 이미지 및 후처리(예: JPEG 압축, 크기 조정, 감마 보정)에 노출된 이미지에서 카메라 모델을 식별하고 후처리를 탐지하기 위해 다중 척도 패치 추출과 경험적 모드 분해(Empirical Mode Decomposition, EMD)를 활용한 DenseNet-201 기반 파이프라인을 제안한다. IEEE SP 컵 2018 데이터셋에서는 98.37%의 정확도를 달성하고, 드레스덴 데이터베이스에서는 99% 이상의 정확도를 기록하여 단일 모델 기반 이미지 조작 탐지에 있어 최신 기술 수준의 성능과 일반화 능력을 입증한다.

ABSTRACT

Camera model identification has earned paramount importance in the field of image forensics with an upsurge of digitally altered images which are constantly being shared through websites, media, and social applications. But, the task of identification becomes quite challenging if metadata are absent from the image and/or if the image has been post-processed. In this paper, we present a DenseNet pipeline to solve the problem of identifying the source camera-model of an image. Our approach is to extract patches of 256*256 from a labeled image dataset and apply augmentations, i.e., Empirical Mode Decomposition (EMD). We use this extended dataset to train a Neural Network with the DenseNet-201 architecture. We concatenate the output features for 3 different sizes (64*64, 128*128, 256*256) and pass them to a secondary network to make the final prediction. This strategy proves to be very robust for identifying the source camera model, even when the original image is post-processed. Our model has been trained and tested on the Forensic Camera-Model Identification Dataset provided for the IEEE Signal Processing (SP) Cup 2018. During testing we achieved an overall accuracy of 98.37%, which is the current state-of-the-art on this dataset using a single model. We used transfer learning and tested our model on the Dresden Database for Camera Model Identification, with an overall test accuracy of over 99% for 19 models. In addition, we demonstrate that the proposed pipeline is suitable for other image-forensic classification tasks, such as, detecting the type of post-processing applied to an image with an accuracy of 96.66% -- which indicates the generality of our approach.

연구 동기 및 목표

메타데이터가 없는 이미지와 후처리(예: JPEG 압축, 크기 조정, 감마 보정)를 겪은 이미지에서 카메라 모델을 식별하는 문제에 대응하기 위해.
다양한 데이터셋에 일반화되며 이미지 조작에 강건한 딥러닝 파이프라인을 개발하기 위해.
학습된 특징의 이식 가능성을 관련 포렌식 작업(예: 이미지에 적용된 후처리 유형 탐지)에 적용함을 보여주기 위해.
단일 모델을 사용하여 IEEE SP 컵 2018 카메라 모델 식별 벤치마크에서 최신 기술 수준의 성능을 달성하기 위해.

제안 방법

라벨이 부여된 이미지에서 256×256 패치를 추출하고, 훈련 세트를 확장하기 위해 경험적 모드 분해(EMD)를 활용한 데이터 증강을 적용한다.
다양한 스케일(64×64, 128×128, 256×256 패치)에서 카메라 고유의 특징을 학습하기 위해 증강된 데이터셋으로 DenseNet-201 모델을 훈련시킨다.
세 가지 다른 패치 크기에서 유도된 특징 맵을 결합하여 2차 분류기로 전달해 최종 예측을 수행한다.
교차 데이터셋 평가를 위해 드레스덴 데이터베이스에서 전이 학습을 활용해 모델을 미세조정한다.
같은 훈련된 모델을 사용해 네 가지 유형의 이미지 조작(그대로, JPEG 압축, 감마 보정, 크기 조정)을 분류한다.
DenseNet-201 아키텍처 내부에 Squeeze-and-Excitation(SE) 모듈을 통합하여 특징 표현 학습 능력을 향상시킨다.

실험 결과

연구 질문

RQ1메타데이터에 의존하지 않고도 단일 딥러닝 모델이 카메라 모델 식별에서 최신 기술 수준의 정확도를 달성할 수 있는가?
RQ2경험적 모드 분해(EMD)가 카메라 모델 식별에서 후처리에 대한 강건성을 향상시키기 위한 데이터 증강 기법으로 얼마나 효과적인가?
RQ3IEEE SP 컵 2018 데이터셋에서 학습된 특징이 드레스텐 데이터베이스와 같은 다른 데이터셋으로 얼마나 잘 일반화되는가?
RQ4동일한 모델 아키텍처로 다양한 유형의 이미지 조작을 높은 정확도로 탐지할 수 있는가?

주요 결과

제안된 파이프라인은 IEEE SP 컵 2018 데이터셋에서 테스트 정확도 98.37%를 달성하여 단일 모델 기반 성능으로 새로운 최신 기술 수준을 수립했다.
드레스텐 데이터베이스에서는 19개의 카메라 모델에 대해 99% 이상의 정확도를 기록했으며, 카메라 모델의 제조업체 식별에 100% 정확도를 달성했다.
모델는 강력한 일반화 능력을 보였으며, 그대로, JPEG 압축, 감마 보정, 크기 조정된 이미지 등 네 가지 유형의 이미지 조작을 96.66%의 정확도로 탐지했다.
오류 탐지의 대부분은 동일 제조사에서 생산된 모델 간에 국한되어 있었으며, 이는 공통된 보간 또는 CFA 패턴이 혼동의 원인임을 시사한다.
전이 학습 덕분에 훈련 세트가 상당히 작음에도 불구하고 드레스텐 데이터셋에서 높은 성능를 달성했으며, 이는 효과적인 특징 이식 가능성을 시사한다.
EMD를 새로운 데이터 증강 기법으로 활용함으로써, 특히 후처리 조건 하에서 강건성이 향상됨을 입증했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.