QUICK REVIEW

[논문 리뷰] DENSE: Data-Free One-Shot Federated Learning

Jie Zhang, Chen Chen|arXiv (Cornell University)|2021. 12. 23.

Privacy-Preserving Technologies in Data인용 수 33

한 줄 요약

DENSE는 클라이언트 모델의 앙상블로부터 합성 데이터를 생성하고 두 단계에 걸쳐 지식을 글로벌 모델로 증류하여 이질적인 클라이언트 모델을 갖는 데이터 프리(data-free) 원샷 연합 학습을 수행합니다.

ABSTRACT

One-shot Federated Learning (FL) has recently emerged as a promising approach, which allows the central server to learn a model in a single communication round. Despite the low communication cost, existing one-shot FL methods are mostly impractical or face inherent limitations, \eg a public dataset is required, clients' models are homogeneous, and additional data/model information need to be uploaded. To overcome these issues, we propose a novel two-stage extbf{D}ata-fre extbf{E} o extbf{N}e- extbf{S}hot federated l extbf{E}arning (DENSE) framework, which trains the global model by a data generation stage and a model distillation stage. DENSE is a practical one-shot FL method that can be applied in reality due to the following advantages: (1) DENSE requires no additional information compared with other methods (except the model parameters) to be transferred between clients and the server; (2) DENSE does not require any auxiliary dataset for training; (3) DENSE considers model heterogeneity in FL, \ie different clients can have different model architectures. Experiments on a variety of real-world datasets demonstrate the superiority of our method.For example, DENSE outperforms the best baseline method Fed-ADI by 5.08\% on CIFAR10 dataset.

연구 동기 및 목표

보조 데이터 없이 또는 민감한 정보를 공유하지 않고도 실용적인 원샷 연합 학습의 필요성을 제시한다.
매개변수 평균화를 피함으로써 클라이언트 간의 모델 이질성을 가능하게 한다.
앙상블 모델에서의 합성 데이터 생성과 글로벌 모델로의 지식 증류라는 두 단계 프레임워크를 개발한다.
실제 클라이언트 데이터를 노출하지 않는 프라이버시 보장 데이터 생성을 보장한다.
비 IID의 실제 데이터 세트와 이질적인 클라이언트 아키텍처에서의 효과를 입증한다.

제안 방법

Stage 1: 보조 제너레이터를 앙상블 모델을 사용하여 훈련시키고, 실제 데이터를 노출하지 않으면서 클라이언트의 훈련 분포를 닮은 합성 데이터를 생성한다.
유사도(평균 로짓), 안정성(BN 통계), 전달성(경계 인식 손실)을 사용하여 제너레이터를 최적화한다.
KL 발산을 통한 경계 지원 손실을 도입하여 앙상블 모델과 글로벌 모델의 의사결정 경계 사이에 위치하는 합성 데이터를 촉진한다.
Stage 2: 합성 데이터를 사용하여 앙상블 교사로부터 글로벌 학생 모델로 지식을 증류하고, 앙상블 로짓과 글로벌 모델 예측 사이의 KL 발산을 최소화한다.
매개변수 평균화가 아닌 평균 로짓을 통해 지식을 집계함으로써 이질적인 클라이언트 아키텍처를 가능하게 한다.
불균형 학습 기법(예: LDAM)과 함께 DENSE를 선택적으로 결합하여 불균형한 데이터에서 성능을 더욱 향상시킨다.

실험 결과

연구 질문

RQ1데이터 없이 원샷으로 수행하는 연합 학습 프레임워크가 보조 데이터나 원시 데이터를 공유하지 않고도 강력한 글로벌 모델을 학습할 수 있는가?
RQ2매개변수 평균화 대신 앙상블 증류를 통해 클라이언트 간 모델 이질성을 지원할 수 있는가?
RQ3합성 데이터 생성과 지식 증류의 두 단계가 비 IID 설정에서 FedAvg 및 데이터 프리 베이스라인보다 성능이 우수한가?
RQ4BN 기반 안정성과 경계 인식 손실이 합성 데이터의 품질과 최종 글로벌 모델에 어떤 영향을 미치는가?
RQ5클라이언트 수의 변화 및 불균형 학습 기법의 적용이 DENSE의 성능에 어떤 영향을 주는가?

주요 결과

DENSE는 다수의 실제 데이터 세트와 비 IID 설정에서 강력한 베이스라인(Fed-ADI 등)보다 더 높은 정확도를 달성한다.
DENSE는 특히 비 IID 및 이질적 모델 시나리오에서 FedAvg를 지속적으로 능가한다.
두 단계 접근은 매개변수 평균화 없이 이질적인 클라이언트 모델에서 단일 글로벌 모델로의 효과적인 지식 전달을 가능하게 한다.
불균형 데이터에 대한 LDAM 적용은 특히 매우 편향된 CIFAR10 및 SVHN 설정에서 성능을 더욱 개선한다.
여러 통신 라운드로 확장하면 정확도가 더 향상된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.