QUICK REVIEW

[논문 리뷰] PPFL: Privacy-preserving Federated Learning with Trusted Execution Environments

Fan Mo, Hamed Haddadi|arXiv (Cornell University)|2021. 04. 29.

Privacy-Preserving Technologies in Data참고 문헌 68인용 수 40

한 줄 요약

PPFL은 클라이언트와 서버 모두의 TEEs 안에서 DNN 레이어를 훈련시키는 프라이버시 보호 연합 학습 프레임워크를 제안하며, 제한된 TEE 메모리에 대응하기 위해 탐욕적 레이어-와이즈 훈련을 사용하고, 통신 라운드를 축소하고 소폭의 오버헤드로 유사한 모델 유용성을 달성한다.

ABSTRACT

We propose and implement a Privacy-preserving Federated Learning ($PPFL$) framework for mobile systems to limit privacy leakages in federated learning. Leveraging the widespread presence of Trusted Execution Environments (TEEs) in high-end and mobile devices, we utilize TEEs on clients for local training, and on servers for secure aggregation, so that model/gradient updates are hidden from adversaries. Challenged by the limited memory size of current TEEs, we leverage greedy layer-wise training to train each model's layer inside the trusted area until its convergence. The performance evaluation of our implementation shows that $PPFL$ can significantly improve privacy while incurring small system overheads at the client-side. In particular, $PPFL$ can successfully defend the trained model against data reconstruction, property inference, and membership inference attacks. Furthermore, it can achieve comparable model utility with fewer communication rounds (0.54$ imes$) and a similar amount of network traffic (1.002$ imes$) compared to the standard federated learning of a complete model. This is achieved while only introducing up to ~15% CPU time, ~18% memory usage, and ~21% energy consumption overhead in $PPFL$'s client-side.

연구 동기 및 목표

연합 학습에서의 프라이버시 위험과 데이터 재구성, 속성 추론, 멤버십 추론에 대한 더 강력한 보호의 필요성을 제시한다.
FL 중 모든 레이어를 보호하기 위해 각 DNN 레이어를 TEEs 내부에서 훈련시키는 실용적인 프레임워크인 PPFL을 제안한다.
제한된 TEE 메모리를 극복하면서도 모델 유용성을 유지하기 위해 레이어-별 학습과 안전한 집계를 가능하게 한다.

제안 방법

탐욕적 레이어-와이즈 학습과 안전한 집계를 사용하여 각 DNN 레이어를 클라이언트 TEEs 내부에서 훈련시킨다.
일반 데이터 교환을 위한 REE-to-REE와 개인 레이어 업데이트를 위한 TEE-to-TEE의 두 개의 보안 채널을 사용한다.
서버 TEE 내부에서 레이어 업데이트를 안전하게 집계하고 FedAvg를 적용하여 새로운 글로벌 레이어를 형성한다.
TEE 메모리 활용을 개선하고 라운드를 줄이기 위해 블록당 다중 레이어의 훈련을 지원한다.
전방향 및 역방향 패스 중 REEs와 TEEs 간에 중간 활성화 값을 전달하기 위해 모델 분할 실행을 활용한다.

실험 결과

연구 질문

RQ1PPFL이 FL에서 학습된 모든 DNN 레이어에 대해 데이터 재구성, 속성 추론, 멤버십 추론 공격을 차단할 수 있는가?
RQ2TEE 내부에서 탐욕적 레이어-와이즈 학습을 사용할 때 프라이버시 보장, 모델 유용성, 시스템 오버헤드 간의 트레이드오프는 무엇인가?
RQ3PPFL은 표준 엔드투엔드 FL과 비교하여 라운드 수, 네트워크 트래픽, 클라이언트 측 자원 사용 측면에서 어떻게 다른가?

주요 결과

PPFL은 학습된 모델을 데이터 재구성, 속성 추론, 멤버십 추론 공격으로부터 방어할 수 있다(공격은 임의 추정이나 50% 정밀도로 약화된다).
PPFL은 전체 모델 학습 시 표준 FL에 비해 약 0.54배의 더 적은 통신 라운드와 1.002배의 유사한 네트워크 트래픽으로, 처음 몇 개의 레이어만 학습할 때는 ML 성능이 비슷하다.
PPFL은 클라이언트 측에서 최대 약 15%의 CPU 시간, 약 18%의 메모리 사용량, 약 21%의 에너지 소비 오버헤드를 도입한다.
PPFL로 모든 DNN 레이어를 학습시키면 엔드투엔드 FL보다 대략 3배의 지연이 발생하지만, 초기 레이어에 집중하면 레이어-와이즈 학습이 비슷한 유틸리티를 달성할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.