Skip to main content
QUICK REVIEW

[논문 리뷰] Variational Federated Multi-Task Learning

Luca Corinzia, Joachim M. Buhmann|arXiv (Cornell University)|2019. 06. 14.
Privacy-Preserving Technologies in Data참고 문헌 66인용 수 121
한 줄 요약

VIRTUAL은 비볼록(non-convex) 모델에 대한 연합 다중 작업 학습을 스타 모양의 베이지안 네트워크와 변분 추론을 이용하여 도입하고, FedAvg/FedProx보다 더 나은 성능과 더 희박한 업데이트를 달성한다.

ABSTRACT

In federated learning, a central server coordinates the training of a single model on a massively distributed network of devices. This setting can be naturally extended to a multi-task learning framework, to handle real-world federated datasets that typically show strong statistical heterogeneity among devices. Despite federated multi-task learning being shown to be an effective paradigm for real-world datasets, it has been applied only on convex models. In this work, we introduce VIRTUAL, an algorithm for federated multi-task learning for general non-convex models. In VIRTUAL the federated network of the server and the clients is treated as a star-shaped Bayesian network, and learning is performed on the network using approximated variational inference. We show that this method is effective on real-world federated datasets, outperforming the current state-of-the-art for federated learning, and concurrently allowing sparser gradient updates.

연구 동기 및 목표

  • 강하게 비 IID(비동질적) 클라이언트 데이터와 함께 연합 다중 작업 학습의 문제에 대응한다.
  • 분산 네트워크에 적합한 비볼록 연합 다중 작업 학습 알고리즘을 개발한다.
  • 사전 지식 공유와 프라이버시 보장을 위해 베이지안 네트워크와 변분/추론 기법을 활용한다.
  • 통신 비용을 줄이기 위해 희박한 그래디언트 업데이트를 가능하게 한다.

제안 방법

  • 공유 파라미터와 비공유(개인) 파라미터를 가진 스타 모양의 베이지안 네트워크로 서버와 클라이언트를 모델링한다.
  • 서버 및 클라이언트 파라미터의 후방를 근사하기 위해 EP-유사 변분 추론 체계를 사용한다.
  • 계산적으로 다루기 쉬운 업데이트를 돕기 위해 서버 및 클라이언트 파라미터에 가우시안 평균장(mean-field) 후방을 채택한다.
  • 클라이언트 업데이트를 각자의 후방 요인 변화(delta)로 계산하고 서버에서 이를 집계한다.
  • 개별 클라이언트 파라미터가 아니라 서버 후방의 집계와 클라이언트 델타의 곱만 공유하여 프라이버시를 유지한다.
  • KL-발산 가중 자유 에너지 항을 도입하여 서버와 클라이언트 간의 재구성과 정규화 사이의 균형을 맞춘다.

실험 결과

연구 질문

  • RQ1연합 설정에서 연합 다중 작업 학습을 일반적인 비볼록 모델에 효과적으로 확장할 수 있는가?
  • RQ2비 IID 데이터를 다루면서 지식 전달을 가능하게 하기 위해 별 모양의 서버-클라이언트 베이지안 네트워크에 변분 추론을 어떻게 적용할 수 있는가?
  • RQ3VIRTUAL이 실제 연합 데이터셋에서 FedAvg, FedProx와 같은 기존 FL 기준선을 능가하면서 희박한 업데이트를 가능하게 하는가?
  • RQ4KL-발산 가중치가 학습 성능과 업데이트의 희소성에 미치는 영향은 무엇인가?

주요 결과

  • VIRTUAL은 여러 아키텍처에 걸친 여러 실제 데이터셋에서 최첨단 연합 학습 기준선을 능가한다.
  • 이 프레임워크는 정확도를 유지하거나 향상시키면서 클라이언트 업데이트를 더 희소하게 만든다.
  • 클라이언트 모델은 여전히 프라이버시를 유지하고 데이터에 특화될 수 있으며, 공유된 서버 지식으로부터 혜택을 얻는다.
  • KL-발산 정규화 곱(beta)을 사용하면 성능과 희소성을 조정할 수 있다.
  • 이 방법은 중앙 집중식 데이터 접근 없이도 비 IID 데이터 및 전통적인 FL 문제를 지원한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.