QUICK REVIEW

[논문 리뷰] Detecting and Simulating Artifacts in GAN Fake Images

Xu Zhang, Svebor Karaman|arXiv (Cornell University)|2019. 07. 15.

Digital Media Forensic Detection참고 문헌 15인용 수 41

한 줄 요약

본 논문은 GAN 아티팩트를 시뮬레이션하는 AutoGAN과 GAN 생성 이미지를 구분하는 스펙트럼 기반 탐지기를 소개하여, 대상 GAN 모델에 접근할 수 없더라도 강한 일반화 성능을 달성한다.

ABSTRACT

To detect GAN generated images, conventional supervised machine learning algorithms require collection of a number of real and fake images from the targeted GAN model. However, the specific model used by the attacker is often unavailable. To address this, we propose a GAN simulator, AutoGAN, which can simulate the artifacts produced by the common pipeline shared by several popular GAN models. Additionally, we identify a unique artifact caused by the up-sampling component included in the common GAN pipeline. We show theoretically such artifacts are manifested as replications of spectra in the frequency domain and thus propose a classifier model based on the spectrum input, rather than the pixel input. By using the simulated images to train a spectrum based classifier, even without seeing the fake images produced by the targeted GAN model during training, our approach achieves state-of-the-art performances on detecting fake images generated by popular GAN models such as CycleGAN.

연구 동기 및 목표

공격자 모델이 알려지지 않은 경우 real-vs-GAN 위조 이미지 탐지의 강건성 동기를 부여한다.
주로 주파수 도메인에서 GAN 업샘플링으로 인한 아티팩트를 식별한다.
실제 이미지만을 사용하여 일반적인 GAN 파이프라인을 시뮬레이션하는 AutoGAN을 개발한다.
카테고리 간 일반화를 향상시키기 위한 스펙트럼 기반 분류기를 제안한다.
보지 않은 GAN 모델과 후처리 효과에 대한 일반화를 평가한다.

제안 방법

주파수 도메인에서 업샘플링 아티팩트를 식별하기 위해 GAN 생성 파이프라인을 분석한다.
업샘플링 중 제로 삽입이 스펙트럼을 복제한다는 이론적 근거를 제시하여 스펙트럼 기반 입력을 고무한다.
RGB 채널의 로그-크기 스펙트럼을 입력으로 사용하는 주파수 도메인 분류기를 제안한다.
가짜 학습 데이터 없이 GAN과 같은 아티팩트를 재구성하는 그레이박스 GAN 시뮬레이터인 AutoGAN을 도입한다.
실제 이미지와 AutoGAN으로 재구성된 이미지를 사용해 분류기를 학습하여 GAN 아티팩트를 포착한다.
다중 의미 범주에 걸친 탐지 평가, 특히 카테고리 하나를 남겨두는 설정(leave-one-category-out)을 포함하고, 후처리 및 서로 다른 업샘플러에 대한 강건성을 테스트한다.

실험 결과

연구 질문

RQ1스펙트럼 기반 입력이 픽셀 기반 입력과 비교하여 GAN 위조 이미지 탐지 및 카테고리 간 일반화를 향상시킬 수 있는가?
RQ2GAN 시뮬레이터(AutoGAN)가 실제 가짜 이미지나 대상 GAN 모델에 접근하지 않고도 효과적인 탐지기를 훈련시킬 수 있는가?
RQ3스펙트럼 기반 탐지기가 보지 않은 GAN 구조나 업샘플링 모듈에 얼마나 잘 일반화되는가?
RQ4후처리(JPEG, 리사이즈)가 탐지에 미치는 영향은 무엇이며 재학습으로 완화할 수 있는가?

주요 결과

CycleGAN 데이터로 학습했을 때, 스펙트럼 기반 분류기가 픽셀 기반과 비교해 카테고리 간 일반화가 더 우수하다.
AutoGAN은 어떤 가짜 이미지도 필요 없이 훈련이 가능하고 CycleGAN 데이터에서 여전히 강건한 탐지 성능을 보여준다.
leave-one-out 평가에서 CycleGAN 또는 AutoGAN 훈련을 사용한 스펙트럼 기반 방법은 최신 방법과 경쟁력이 있다.
JPEG 압축이나 리사이즈와 같은 후처리는 재처리된 데이터로 재학습하지 않으면 성능을 저하시킨다.
훈련 중 업샘플러를 결합하는 것(Transposed Convolution과 Nearest Neighbor)이 샘플러 간 일반화를 향상시킨다.
GauGAN 결과는 급격한 아키텍처 차이가 교차 모델 일반화를 제한하는 반면, StarGAN 결과는 스펙트럼 기반 탐지기에 더 우호적이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.