Skip to main content
QUICK REVIEW

[논문 리뷰] Asynchronous Federated Learning with Differential Privacy for Edge Intelligence

Yanan Li, Shusen Yang|arXiv (Cornell University)|2019. 12. 17.
Privacy-Preserving Technologies in Data참고 문헌 53인용 수 27
한 줄 요약

이 논문은 이질적인 엣지-클라우드 환경에서 비밀성 보장이 있는 비동기 분산 학습(AFL)에 적합한 다단계 조정 가능한 개인 정보 보호 알고리즘인 MAPA를 제안한다. 이 알고리즘은 차별적 비밀성과 모델 유틸리티 사이의 균형을 위해 노이즈 스케일과 학습률을 동적으로 조정한다. 최신 기술 대비 더 빠른 수렴 속도와 높은 정확도를 달성하였으며, 이론적 수렴 분석과 시뮬레이션 및 실세계 실험 테스트베드를 통한 검증을 수행하였다.

ABSTRACT

Federated learning has been showing as a promising approach in paving the last mile of artificial intelligence, due to its great potential of solving the data isolation problem in large scale machine learning. Particularly, with consideration of the heterogeneity in practical edge computing systems, asynchronous edge-cloud collaboration based federated learning can further improve the learning efficiency by significantly reducing the straggler effect. Despite no raw data sharing, the open architecture and extensive collaborations of asynchronous federated learning (AFL) still give some malicious participants great opportunities to infer other parties' training data, thus leading to serious concerns of privacy. To achieve a rigorous privacy guarantee with high utility, we investigate to secure asynchronous edge-cloud collaborative federated learning with differential privacy, focusing on the impacts of differential privacy on model convergence of AFL. Formally, we give the first analysis on the model convergence of AFL under DP and propose a multi-stage adjustable private algorithm (MAPA) to improve the trade-off between model utility and privacy by dynamically adjusting both the noise scale and the learning rate. Through extensive simulations and real-world experiments with an edge-could testbed, we demonstrate that MAPA significantly improves both the model accuracy and convergence speed with sufficient privacy guarantee.

연구 동기 및 목표

  • 이질적인 엣지-클라우드 시스템에서 차별적 비밀성(DP)을 고려한 비동기 분산 학습(AFL)의 개인정보-유틸리티 균형 문제를 해결하기 위해.
  • 특히 노이즈와 오래된(스태일) 정보의 영향을 분석하여, DP 하에서 AFL의 이론적 수렴 성질을 분석하기 위해.
  • 개인 정보 보호 보장을 해치지 않으면서 모델 유틸리티를 향상시키는 실용적이고 적응형 알고리즘을 설계하기 위해.
  • CNN 모델을 대상으로 광범위한 시뮬레이션과 실세계 실험 테스트베드 실험을 통해 제안된 방법을 검증하기 위해.

제안 방법

  • 기울기 민감도와 오래됨을 기반으로 노이즈 스케일과 학습률을 동적으로 조정하는 다단계 조정 가능한 개인 정보 보호 알고리즘(MAPA)을 제안한다.
  • 차별적 비밀성에 필요한 노이즈를 줄이기 위해 기울기 클리핑 메커니즘을 도입한다.
  • 최대 오래됨(τ_max)에 비례하여 선형 감소하는 학습률을 적용하여 수렴 효율을 향상시킨다.
  • 이론적 분석을 통해 오차 한계를 O(1/√T (σ/√b + ΔS/ε) + τ_max² log T / T)로 유도하였으며, 이는 개인정보, 노이즈, 오래됨 간의 상호 균형을 반영한다.
  • 엄격한 개인정보 보장을 확보하면서도 모델 유틸리티를 유지하기 위해 개인정보 예산(ε)과 δ-근사 DP를 사용한다.
  • 기울기 분산과 최적화 안정성을 제어하기 위해 부드러움 상수(L)와 배치 크기(b)를 적용한다.

실험 결과

연구 질문

  • RQ1차별적 비밀성이 엣지-클라우드 환경에서 비동기 분산 학습의 수렴에 어떤 영향을 미치는가?
  • RQ2노이즈 스케일과 학습률을 동적으로 조정하면 AFL에서 개인정보-유틸리티 균형을 향상시킬 수 있는가?
  • RQ3DP 하에서 AFL의 이론적 오차 한계는 무엇이며, 오래됨과 개인정보 파라미터에 따라 어떻게 달라지는가?
  • RQ4개인정보 제약 조건 하에서 기존 AFL 방법과 비교해 MAPA의 수렴 속도와 모델 정확도는 어떠한가?
  • RQ5ε, σ, δ, 감소 비율 등의 주요 하이퍼파rameter 변화에 대해 MAPA는 어느 정도 강건한가?

주요 결과

  • MAPA는 각 단계에서 O(1/T)의 수렴 속도를 달성하여, 특히 엣지 서버 수(K)가 증가할수록 ASGD 대비 빠른 수렴 속도를 보인다.
  • K = 1000일 때, MAPA는 ASGD 대비 약 2배의 진폭 절감을 달성하여 뛰어난 효율성을 입증한다.
  • 실세계 실험 테스트베드에서 MAPA는 AUDP를 능가하고, MNIST에서 CNN 모델의 정확도는 비개인정보 기반 CSGD와도 맞먹어 강력한 개인정보 보호 조건 하에서도 높은 유틸리티를 확보한다.
  • MAPA의 성능은 σ(표본 분산)와 δ(확률 손실)의 변화에 대해 저감도를 보이며, 이는 이러한 파라미터의 추정 오차에 대해 낮은 민감도를 지님을 시사한다.
  • 감소 비율이 높아지면 학습률 감소가 지나치게 강력해져 모델 정확도가 떨어지며, 이는 이 하이퍼파라미터에 민감함을 확인한다.
  • 큰 배치 크기(b)와 작은 부드러움 상수(L)는 초기 수렴 속도를 향상시키지만 최종 정확도에 영향을 주지 않으며, 이는 일시적인 이점을 의미한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.