[논문 리뷰] Federated Learning with Buffered Asynchronous Aggregation
FedBuff는 연합학습을 위한 버퍼링된 비동기 집계를 도입하여 높은 동시성을 가능하게 하면서 Secure Aggregation 및 differential privacy와의 호환성을 유지하고, 매끄러운 비볼록 설정에서 수렴이 증명되었으며 동기식 및 비동기식 기준선에 비해 실험적으로 효율성을 높인다.
Scalability and privacy are two critical concerns for cross-device federated learning (FL) systems. In this work, we identify that synchronous FL - synchronized aggregation of client updates in FL - cannot scale efficiently beyond a few hundred clients training in parallel. It leads to diminishing returns in model performance and training speed, analogous to large-batch training. On the other hand, asynchronous aggregation of client updates in FL (i.e., asynchronous FL) alleviates the scalability issue. However, aggregating individual client updates is incompatible with Secure Aggregation, which could result in an undesirable level of privacy for the system. To address these concerns, we propose a novel buffered asynchronous aggregation method, FedBuff, that is agnostic to the choice of optimizer, and combines the best properties of synchronous and asynchronous FL. We empirically demonstrate that FedBuff is 3.3x more efficient than synchronous FL and up to 2.5x more efficient than asynchronous FL, while being compatible with privacy-preserving technologies such as Secure Aggregation and differential privacy. We provide theoretical convergence guarantees in a smooth non-convex setting. Finally, we show that under differentially private training, FedBuff can outperform FedAvgM at low privacy settings and achieve the same utility for higher privacy settings.
연구 동기 및 목표
- 프라이버시를 해치지 않으면서 크로스-디바이스 FL의 확장성을 높이는 것을 목표로 한다.
- 업데이트를 적용하기 전에 보안 버퍼에서 업데이트를 집계하는 서버 업데이트 메커니즘을 개발한다.
- Secure Aggregation 및 differential privacy와 같은 프라이버시 기술과의 호환성을 보장한다.
- 매끄러운 비볼록 목적함수 하에서 이론적 수렴 보장을 제공한다.
- 기존의 동기식 및 비동기식 FL 방법에 비해 실험적 효율성 향상을 입증한다.
제안 방법
- FedBuff를 제안한다. 클라이언트 업데이트는 비동기적으로 수집되지만 서버 업데이트는 secure buffer에 K개 업데이트가 축적된 후에만 발생한다.
- 동시성을 서버 업데이트 주기로부터 분리하기 위해 버퍼 크기 K를 사용하며, K = 10이 좋은 기본값으로 확인된다.
- 개인정보를 보존하기 위해 안전한 Trusted Execution Environment(TEE) 또는 암호학적 버퍼에서 업데이트를 집계한다.
- 로컬 스텝 Q 및 오래된 업데이트를 고려하여 매끄러운 비볼록 설정에서 FedBuff의 수렴 분석을 제공한다.
- SecAgg 및 DP-FTRL을 통해 FedBuff를 확장하여 차등 프라이버시를 지원하고 GDP 프라이버시 보장을 가능하게 한다.
- 훈련 안정성을 돕기 위해 오래됨 스케일링(staleness scaling) 및 학습률 정규화와 같은 실용적 개선을 도입한다.
실험 결과
연구 질문
- RQ1버퍼링된 비동기 집계가 프라이버시를 해치지 않으면서 크로스-디바이스 FL의 확장성을 개선할 수 있는가?
- RQ2높은 동시성에서 FedBuff의 버퍼 크기 K가 수렴성과 통신 효율성에 어떤 영향을 미치는가?
- RQ3FedBuff가 Secure Aggregation 및 차등 프라이버시와 호환되는가, 그리고 DP가 수렴에 어떤 영향을 미치는가?
- RQ4비동기 업데이트 하의 매끄러운 비볼록 목적함수에서 FedBuff의 이론적 수렴 보장은 무엇인가?
- RQ5오래됨 가중치(staleness weighting)와 학습률 정규화와 같은 실용 기술이 성능에 어떤 영향을 미치는가?
주요 결과
- 실험에서 FedBuff는 최고 동기식 기준선보다 최대 3.8배 높은 효율을 달성했다.
- 보고된 벤치마크에서 가장 근접한 비동기 방법보다 최대 2.5배 더 높은 성능을 보인다.
- 버퍼 크기 K=10은 CelebA, Sent140, CIFAR-10 작업에서 일관되게 강한 성능을 제공한다.
- FedBuff는 Secure Aggregation과의 호환성을 유지하며 GDP 보장을 가진 차등 프라이버시로 확장될 수 있다.
- DP 하에서 FedBuff는 저 프라이버시 설정에서 증폭된 DP-SGD를 사용하는 동기식 FedAvgM보다 우수하고, 더 높은 프라이버시 설정에서 성능을 맞춘다.
- 이론적 결과는 FedBuff의 매끄러운 비볼록성에서 ergodic 수렴 속도 경계가 있음을 시사한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.