[논문 리뷰] Ditto: Fair and Robust Federated Learning Through Personalization
Ditto는 전역 규제(global-regularized) 다중 작업 학습 접근법을 연합학습에 도입하여 디바이스별 모델을 개인화하면서도 전역 목표를 유지하고, 정확도 향상, 데이터/모델 오염에 대한 강건성, 디바이스 간 공정성을 달성합니다.
Fairness and robustness are two important concerns for federated learning systems. In this work, we identify that robustness to data and model poisoning attacks and fairness, measured as the uniformity of performance across devices, are competing constraints in statistically heterogeneous networks. To address these constraints, we propose employing a simple, general framework for personalized federated learning, Ditto, that can inherently provide fairness and robustness benefits, and develop a scalable solver for it. Theoretically, we analyze the ability of Ditto to achieve fairness and robustness simultaneously on a class of linear problems. Empirically, across a suite of federated datasets, we show that Ditto not only achieves competitive performance relative to recent personalization methods, but also enables more accurate, robust, and fair models relative to state-of-the-art fair or robust baselines.
연구 동기 및 목표
- 통계적으로 이질적인 연합 네트워크에서 공정성과 강건성 간의 트레이드오프를 다룬다.
- 전역 모델을 향해 개인화 모델을 규제하는 단순하지만 확장 가능한 개인화 프레임워크(Ditto)를 제안한다.
- 수렴 보장을 제시하고 Ditto가 정확도, 강건성 및 공정성에서 최첨단 기준과 대등하거나 이를 능가함을 보인다.
- 다양한 데이터셋과 공격에 걸쳐 개인화가 FL의 강건성과 공정성을 본질적으로 어떻게 향상시키는지 분석한다.
제안 방법
- Ditto를 이중 최적화 문제로 형식화한다: 각 디바이스 k에 대해 F_k(v_k) + (lambda/2) ||v_k - w^*||^2를 최소화하되, w^*는 축적된 목적 G(F_1(w), ..., F_K(w))의 최적 글로벌 모델이다.
- 표준 FL 솔버를 이용해 서버가 현재 글로벌 모델 w^t를 갱신하고 각 디바이스가 로컬 업데이트를 통해 근사적으로 min_v_k F_k(v_k) + (lambda/2)||v_k - w^t||^2를 해결하며 개인화 모델 v_k를 갱신하는 교대 최적화 알고리즘(Algorithm 1)을 사용한다.
- 전역 목적을 위한 아무 G(·) 솔버도 활용 가능하도록 모듈러리티를 유지하여 프라이버시와 통신 특성을 보존한다.
- 수렴 보장을 제공한다: F_k가 강한 볼록성(convex)과 매끄러움을 갖고 w^t가 w^*로 수렴하면 v_k^t도 v_k^*로 수렴하며 관련 속도(Theorem 1)가 존재한다.
- Ditto의 공정성/강건성 트레이드오프를 선형 문제 클래스에 대해 분석하고 최적의 lambda*를 도출하며 Pareto 이점을 보인다.
실험 결과
연구 질문
- RQ1개인화 연합학습이 전역 규제 다중 작업 학습을 통해 이질적인 FL 설정에서 정확도, 강건성, 공정성을 동시에 향상시킬 수 있는가?
- RQ2Ditto 정규화 매개변수 lambda가 로컬 개인화와 글로벌 일관성을 어떻게 균형 잡아 공정성을 강화하고 학습 시 공격으로부터 방어하는가?
- RQ3제한된 디바이스 참여, 로컬 업데이트 등 일반적인 FL 관행에서 Ditto 솔버가 갖는 수렴 특성은 무엇인가?
- RQ4Ditto의 공정성 및 강건성 이점이 비볼록 모델과 실제 FL 벤치마크를 포함한 비볼록 설정으로 일반화되는가?
주요 결과
| Dataset | Attack level | Global | Local | Fair (TERM, t=1) | Ditto |
|---|---|---|---|---|---|
| Fashion MNIST | A1 clean | 0.911 (0.08) | 0.876 (0.10) | 0.909 (0.07) | 0.943 (0.06) |
| Fashion MNIST | A1 20% adversaries | 0.897 (0.08) | 0.874 (0.10) | 0.751 (0.12) | 0.944 (0.07) |
| Fashion MNIST | A1 50% adversaries | 0.855 (0.10) | 0.876 (0.11) | 0.637 (0.13) | 0.937 (0.07) |
| Fashion MNIST | A1 80% adversaries | 0.753 (0.13) | 0.879 (0.10) | 0.547 (0.11) | 0.907 (0.10) |
| Fashion MNIST | A2 20% adversaries | 0.900 (0.08) | 0.874 (0.10) | 0.731 (0.13) | 0.938 (0.07) |
| Fashion MNIST | A2 50% adversaries | 0.882 (0.09) | 0.876 (0.11) | 0.637 (0.14) | 0.930 (0.08) |
| Fashion MNIST | A2 80% adversaries | 0.857 (0.10) | 0.879 (0.10) | 0.653 (0.13) | 0.913 (0.09) |
| Fashion MNIST | A3 10% adversaries | 0.753 (0.10) | 0.874 (0.10) | 0.601 (0.12) | 0.921 (0.09) |
| Fashion MNIST | A3 20% adversaries | 0.551 (0.13) | 0.876 (0.10) | 0.131 (0.16) | 0.902 (0.09) |
| Fashion MNIST | A3 50% adversaries | 0.275 (0.12) | 0.874 (0.10) | 0.131 (0.16) | 0.873 (0.11) |
| FEMNIST | A1 clean | 0.804 (0.11) | 0.628 (0.15) | 0.809 (0.11) | 0.834 (0.09) |
| FEMNIST | A1 20% adversaries | 0.773 (0.11) | 0.620 (0.14) | 0.636 (0.15) | 0.802 (0.10) |
| FEMNIST | A1 50% adversaries | 0.727 (0.12) | 0.627 (0.14) | 0.562 (0.13) | 0.762 (0.11) |
| FEMNIST | A1 80% adversaries | 0.574 (0.15) | 0.607 (0.14) | 0.478 (0.12) | 0.672 (0.13) |
| FEMNIST | A2 10% adversaries | 0.774 (0.11) | 0.620 (0.14) | 0.440 (0.15) | 0.801 (0.09) |
| FEMNIST | A2 15% adversaries | 0.703 (0.14) | 0.627 (0.14) | 0.336 (0.12) | 0.700 (0.15) |
| FEMNIST | A2 20% adversaries | 0.636 (0.15) | 0.607 (0.14) | 0.353 (0.12) | 0.675 (0.14) |
| FEMNIST | A3 10% adversaries | 0.517 (0.14) | 0.607 (0.14) | 0.316 (0.12) | 0.685 (0.15) |
| FEMNIST | A3 15% adversaries | 0.487 (0.14) | 0.620 (0.14) | 0.299 (0.11) | 0.650 (0.14) |
| FEMNIST | A3 20% adversaries | 0.314 (0.13) | 0.620 (0.14) | 0.316 (0.12) | 0.613 (0.13) |
- Ditto는 개인화 방법과 비교하여 경쟁력 있는 정확도 또는 우수한 정확도를 달성하며 다양한 연합학습 데이터셋에서 여러 강건성 또는 공정성 기준의 baseline을 능가한다.
- 공격 및 데이터셋에 걸쳐 Ditto는 평균적으로 가장 강력한 강건성 baseline보다 테스트 정확도를 대략 6% 포인트 개선한다.
- Ditto는 디바이스 간 테스트 정확도 분산을 평균 약 10% 감소시켜 공정성 향상을 시사한다.
- Ditto는 강건성을 제공하면서 큰 공정성을 희생하지 않으며, 경우에 따라 최신 기준보다 공정성과 강건성을 모두 개선한다.
- 선형 문제에 대한 이론적 분석은 Ditto 공간에서 가장 정확하고 공정하며 강건한 해를 제공하는 최적의 lambda*를 식별한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.