Skip to main content
QUICK REVIEW

[논문 리뷰] Agnostic Federated Learning

Mehryar Mohri, Gary Sivek|arXiv (Cornell University)|2019. 02. 01.
Privacy-Preserving Technologies in Data참고 문헌 38인용 수 259
한 줄 요약

AFL은 어떠한 클라이언트 분포의 혼합에도 중앙집중식 모델을 최적화하고, 데이터 의존적 일반화 보장을 제공하며, 수렴 증명이 있는 빠른 미니맥스 SGD 알고리즘과 함께 경험적 검증 및 공정성 통찰을 제공합니다.

ABSTRACT

A key learning scenario in large-scale applications is that of federated learning, where a centralized model is trained based on data originating from a large number of clients. We argue that, with the existing training and inference, federated models can be biased towards different clients. Instead, we propose a new framework of agnostic federated learning, where the centralized model is optimized for any target distribution formed by a mixture of the client distributions. We further show that this framework naturally yields a notion of fairness. We present data-dependent Rademacher complexity guarantees for learning with this objective, which guide the definition of an algorithm for agnostic federated learning. We also give a fast stochastic optimization algorithm for solving the corresponding optimization problem, for which we prove convergence bounds, assuming a convex loss function and hypothesis set. We further empirically demonstrate the benefits of our approach in several datasets. Beyond federated learning, our framework and algorithm can be of interest to other learning scenarios such as cloud computing, domain adaptation, drifting, and other contexts where the training and test distributions do not coincide.

연구 동기 및 목표

  • 대상 분포가 알려지지 않았거나 클라이언트 분포의 혼합이 발생할 수 있을 때 연합 학습의 동기를 제시합니다.
  • 클라이언트 간의 혼합 가중치에 대한 최악의 손실로 불가지론적 목적함수를 정의합니다.
  • 가중된 Rademacher 복잡도를 이용한 데이터 의존적 일반화 구간을 개발하여 알고리즘 설계에 가이드를 제공합니다.
  • 볼록 손실 및 가설 공간에서 수렴 보장을 갖는 빠른 확률적 미니맥스 최적화 알고리즘을 제안합니다.
  • 실험적 평가를 통해 이점들을 보여주고 클라우드 학습 및 도메인 적응과 같은 관련 도메인으로의 확장을 논의합니다.

제안 방법

  • 타깃 분포가 임의의 클라이언트 분포의 혼합인 AFL을 형식화하고 불가지론적 손실을 혼합으로 유도된 손실의 최댓값으로 정의합니다.
  • 혼합들에 걸쳐 불가지론적 손실을 상한하기 위한 데이터 의존적 Rademacher 복잡도 프레임워크를 도입합니다.
  • 이 이론으로부터 비대칭성 기반 정규화 항을 도출하여 학습을 지도합니다.
  • 수렴 보장을 갖는 미니맥스 AFL 목적함수를 위한 빠른 확률적 경사하강 알고리즘을 개발합니다.
  • 볼록 최적화 기반 해법 경로(섹션 5.2)를 제공하고 확률적 경사 특성으로 수렴을 분석합니다.
  • 여러 데이터세트에서 접근법을 경험적으로 시연하고 클러스터링 클라이언트 및 기타 도메인으로의 확장을 논의합니다.

실험 결과

연구 질문

  • RQ1연합 학습에서 표준 균일(집계) 분포 대비 클라이언트 분포의 혼합을 최적화하는 것이 어떤 영향을 미치나요?
  • RQ2테스트 분포가 클라이언트 도메인의 혼합일 때 일반화 위험을 어떻게 정량화하고 제어할 수 있나요?
  • RQ3AFL이 보호된 그룹 간의 Good-Intent 공정성 문제를 완화하는 공정성 지향 학습 목표를 제시할 수 있나요?
  • RQ4연합 환경에서 불가지론적 목적을 위한 확장 가능한 최적화를 가능하게 하는 알고리즘과 보장은 무엇인가요?

주요 결과

  • 특정 설정에서 AFL은 불가지론적 손실 측면에서 균일 분포 해보다 일정한 항을 더하여 우수하게 성능을 낼 수 있습니다.
  • 본 논문은 불가지론적 목적에 대한 데이터 의존적 Rademacher 복잡도 상한을 제공하여 알고리즘 설계에 가이드를 제공합니다.
  • 볼록 손실 및 가설 집합에 대해 수렴 보장을 갖는 미니맥스 확률적 최적화 알고리즘이 제안됩니다.
  • 좋은 의도(Fairness)로서의 자연스러운 개념이 나타나며 보호된 하위그룹 간에 예측기가 비슷하게 작동하면서 최악의 하위그룹 손실을 최소화합니다.
  • 여러 데이터셋에서 AFL의 이점을 실험으로 보여주고 도메인 적응, 드리핑, 클라우드 학습 시나리오에의 적용 가능성을 강조합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.