QUICK REVIEW

[논문 리뷰] Privacy Preservation in Federated Learning: An insightful survey from the GDPR Perspective

Nguyen B. Truong, Kai Sun|arXiv (Cornell University)|2020. 11. 10.

Privacy-Preserving Technologies in Data참고 문헌 115인용 수 26

한 줄 요약

이 논문은 EU/UK 일반 개인정보 보호 규정(GDPR)의 시각에서 연합 학습(FL)의 기밀 보장 기법에 대한 종합적인 조사 보고서를 제공한다. 공격 위협과 해결책을 분석하며, FL은 학습 데이터를 현지에 유지함으로써 본질적으로 데이터 기밀성을 향상시키지만, 모델 파라미터가 여전히 민감한 정보를 泄露할 수 있음을 밝혀내며, 차등적 비밀보장과 보안 다자간 계산(SMC)과 같은 추가 기밀 보장 메커니즘이 GDPR 준수를 달성하기 위해 필요하다고 분석한다.

ABSTRACT

Along with the blooming of AI and Machine Learning-based applications and services, data privacy and security have become a critical challenge. Conventionally, data is collected and aggregated in a data centre on which machine learning models are trained. This centralised approach has induced severe privacy risks to personal data leakage, misuse, and abuse. Furthermore, in the era of the Internet of Things and big data in which data is essentially distributed, transferring a vast amount of data to a data centre for processing seems to be a cumbersome solution. This is not only because of the difficulties in transferring and sharing data across data sources but also the challenges on complying with rigorous data protection regulations and complicated administrative procedures such as the EU General Data Protection Regulation (GDPR). In this respect, Federated learning (FL) emerges as a prospective solution that facilitates distributed collaborative learning without disclosing original training data whilst naturally complying with the GDPR. Recent research has demonstrated that retaining data and computation on-device in FL is not sufficient enough for privacy-guarantee. This is because ML model parameters exchanged between parties in an FL system still conceal sensitive information, which can be exploited in some privacy attacks. Therefore, FL systems shall be empowered by efficient privacy-preserving techniques to comply with the GDPR. This article is dedicated to surveying on the state-of-the-art privacy-preserving techniques which can be employed in FL in a systematic fashion, as well as how these techniques mitigate data security and privacy risks. Furthermore, we provide insights into the challenges along with prospective approaches following the GDPR regulatory guidelines that an FL system shall implement to comply with the GDPR.

연구 동기 및 목표

로컬 데이터 저장에도 불구하고 모델 파라미터 유출로 인해 발생하는 연합 학습(FL) 시스템의 기밀 위험을 분석하는 것.
차등적 비밀보장, 보안 다자간 계산(SMC), 암호화된 전송 학습과 같은 기존 기밀 보장 기법들이 GDPR 준수 맥락에서 어떻게 평가되는지 평가하는 것.
데이터 최소화, 목적 제한, 책임성 원칙을 포함한 GDPR 원칙과의 완전한 일치를 방해하는 현재 FL 시스템의 격차를 규명하는 것.
기술적 및 아키텍처적 조치를 통해 FL 기반 서비스 제공자가 GDPR 준수 시스템을 구현하기 위한 실질적인 통찰력과 지침을 제공하는 것.
규제 제약 조건 하에서 기밀 보장 FL 시스템에서 공정성, 해석 가능성, 효율성을 달성하기 위한 열린 연구 과제를 부각하는 것.

제안 방법

모델 유출 공격 및 모델 훼손 공격에 초점을 맞춘 FL 시스템 아키텍처, 위협 모델, 공격 표면을 체계적으로 분석한다.
중앙 집중식 FL 프레임워크에서 차등적 비밀보장, 히든 암호화, 보안 집계(SMC)와 같은 기밀 보장 기법을 분류하고 평가한다.
법적 정당성, 공정성, 투명성, 데이터 최소화와 같은 GDPR 원칙과 기술 구성 요소를 연결한다.
실제로 구현된 FL 시스템에서 기밀 보장, 모델 정확도, 계산 오버헤드 사이의 상충 관계를 평가한다.
데이터 처리 투명성과 책임성과 같은 규제 의무와 기술적 제어를 일치시켜 GDPR 준수를 위한 프레임워크를 제안한다.
비독립적 동일 분포(non-IID) 및 왜곡된 데이터 환경에서의 공정성과 강건성을 향상시키기 위해 무지성 FL과 편향 완화 기법의 최근 발전을 검토한다.

실험 결과

연구 질문

RQ1로컬 데이터 유지에도 불구하고 연합 학습(FL)의 모델 파라미터가 어떻게 민감한 개인 정보를 泄露할 수 있으며, 이러한 유출을 악용하는 유형의 기밀 공격은 무엇인가?
RQ2기존의 기밀 보장 기법—예를 들어 차등적 비밀보장과 SMC—이 FL 시스템에서 GDPR 원칙 준수를 얼마나 잘 달성할 수 있는가?
RQ3특히 데이터 최소화, 목적 제한, 책임성에 관해, FL 시스템을 GDPR 요구사항에 맞추는 데 있어 핵심적인 기술적 및 규제적 과제는 무엇인가?
RQ4암호화 제약 조건 하에서 공정성, 해석 가능성, 편향 완화는 어떻게 효과적으로 기밀 보장 FL 시스템에 통합될 수 있는가?
RQ5실제 FL 구현에서 고급 기밀 보장 메커니즘인 차등적 비밀보장과 히든 암호화를 도입할 경우 성능과 정확도의 상충 관계는 어떻게 나타나는가?

주요 결과

FL은 모델 파라미터가 학습 과정에서 교환되면서 유출 위험이 있기 때문에 본질적으로 GDPR 준수를 보장하지 못한다. 특히 추론 공격를 통해 개인 정보가 유출될 수 있다.
차등적 비밀보장과 보안 다자간 계산(SMC)은 기밀 유출을 효과적으로 줄이지만, 모델 정확도와 계산 오버헤드 측면에서 상당한 상충 관계를 야기한다.
GDPR의 데이터 최소화 원칙은 모델 업데이트가 학습 데이터를 재구성할 수 있을 정도로 충분한 정보를 포함할 경우 도전받는다. 이에 따라 추가적인 왜곡 기법이 필요하다.
모델 훼손 공격은 특히 신뢰가 낮고 탐지가 어려운 탈중앙화된 환경에서 여전히 심각한 위협으로 남아 있다.
비독립적 동일 분포(non-IID) 및 왜곡된 데이터 분포 환경에서 기존의 공정성 및 편향 완화 기법, 예를 들어 무지성 FL은 기밀 보장을 해치지 않으면서도 희망적인 성과를 보이고 있다.
GDPR의 투명성과 책임성 요구사항을 충족시키는 표준화되고 감사 가능하며 해석 가능한 메커니즘이 FL 시스템에 아직 부족하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.