QUICK REVIEW

[논문 리뷰] Protecting Sensitive Attributes via Generative Adversarial Networks

Aria Rezaei, Chaowei Xiao|arXiv (Cornell University)|2018. 01. 01.

Privacy-Preserving Technologies in Data참고 문헌 33인용 수 12

한 줄 요약

이 논문은 타깃 기계학습 응용 프로그램을 위한 유티리티를 유지하면서 데이터의 민감한 속성을 가림으로써 프라이버시를 보장하는 GAN 기반 프레임워크를 제안한다. 컴act하고 효율적인 노이즈 생성 네트워크를 훈련시켜, 성별이나 인종과 같은 민감한 정보를 손상 없이 효과적으로 숨기며, 예측 불가능한 신경망 아키텍처에 대해서도 성능 저하 없이 작동한다.

ABSTRACT

Recent advances in computing have allowed for the possibility to collect large amounts of data on personal activities and private living spaces. Collecting and publishing a dataset in this environment can cause concerns over privacy of the individuals in the dataset. In this paper we examine these privacy concerns. In particular, given a target application, how can we mask sensitive attributes in the data while preserving the utility of the data in that target application. Our focus is on protecting attributes that are hidden and can be inferred from the data by machine learning algorithms. We propose a generic framework that (1) removes the knowledge useful for inferring sensitive information, but (2) preserves the knowledge relevant to a given target application. We use deep neural networks and generative adversarial networks (GAN) to create privacy-preserving perturbations. Our noise-generating network is compact and efficient for running on mobile devices. Through extensive experiments, we show that our method outperforms conventional methods in effectively hiding the sensitive attributes while guaranteeing high performance for the target application. Our results hold for new neural network architectures, not seen before during training and are suitable for training new classifiers.

연구 동기 및 목표

기계학습을 통해 민감한 속성(예: 성별, 인종)이 유추될 수 있는 데이터셋의 프라이버시 리스크를 해결한다.
목표 응용 프로그램을 위한 데이터 유티리티를 훼손하지 않으면서 유추 가능성이 있는 지식을 제거하는 일반적인 프레임워크를 개발한다.
작은 딥 뉴럴 네트워크를 사용하여 프라이버시 보장 전환을 모바일 장치에서 효율적으로 구현할 수 있도록 한다.
훈련 중에 볼 수 없었던 다양한 신경망 아키텍처에 대해 추론 과정에서의 강건성을 확보한다.
민감한 속성이 훼손된 후에도 타깃 모델(예: 분류기)의 높은 성능을 유지한다.

제안 방법

민감한 속성을 가리기 위해 입력 데이터를 훼손하는 노이즈 생성 네트워크를 학습하기 위해 생성적 적대적 네트워크(GANs)를 활용한다.
생성자 네트워크를 훈련시켜, 변형된 데이터에서 민감한 속성을 유추할 수 있는 판별자 네트워크의 능력을 최소화하도록 한다.
목표 응용 프로그램에 관련된 특징을 유지하기 위해 작업별 손실을 사용하여 생성자 네트워크를 동시에 최적화한다.
모바일 장치에서의 효율적 추론을 위해 노이즈 생성 네트워크에 컴act한 아키텍처를 사용한다.
사전 정의된 손실 함수를 사용하여 종합적인 손실(프라이버시를 위한 적대적 손실 및 유티리티를 위한 작업별 손실)을 기반으로 프레임워크를 종단 간(end-to-end)으로 훈련시킨다.
훈련된 훼손 네트워크를 새로운, 볼 수 없는 데이터 샘플에 적용하여 모델 훈련 또는 추론 이전에 민감한 속성을 가린다.

실험 결과

연구 질문

RQ1GAN 기반 프레임워크는 타깃 기계학습 작업의 성능을 떨어뜨리지 않으면서도, 표본 또는 이미지 데이터의 민감한 속성을 효과적으로 숨길 수 있는가?
RQ2제안된 방법은 훈련 중에 볼 수 없었던 신경망 아키텍처에 대해 얼마나 잘 일반화되는가?
RQ3기존의 훼손 기법에 비해, 이 방법은 후속 작업에 대한 데이터 유티리티를 어느 정도 유지하는가?
RQ4노이즈 생성 네트워크를 모바일 장치에 배포하기에 충분히 컴act하고 효율적으로 만들 수 있는가?
RQ5공격자가 변형된 데이터에 대해 고급 추론 모델을 사용하더라도 프레임워크가 여전히 프라이버시를 유지하는가?

주요 결과

제안된 GAN 기반 방법은 기준선 방법에 비해 기계학습 모델이 민감한 속성을 유추할 수 있는 능력을 크게 감소시킨다.
이 프레임워크는 이미지 분류와 같은 타깃 응용 프로그램에서, 새로운 볼 수 없는 신경망 아키텍처에 적용된 후에도 높은 성능을 유지한다.
노이즈 생성 네트워크는 컴act하고 효율적이며, 프라이버시나 유티리티를 희생시키지 않고도 모바일 장치에서 실시간 추론을 가능하게 한다.
광범위한 실험을 통해 이 방법은 기존의 데이터 훼손 기법에 비해 프라이버시 보호 및 작업 유티리티 측면에서 뛰어난 성능을 보였다.
이 방법은 새로운 모델에 대해 잘 일반화되며, 다양한 아키텍처와 데이터셋에서 일관된 프라이버시 보호 및 유티리티 유지 성능을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.