Skip to main content
QUICK REVIEW

[論文レビュー] Asynchronous Online Federated Learning for Edge Devices.

Yujing Chen, Yue Ning|arXiv (Cornell University)|Nov 5, 2019
Privacy-Preserving Technologies in Data参考文献 40被引用数 48
ひとこと要約

本稿では、エッジデバイスが継続的なデータストリームに対してオンライン学習を実行でき、中央サーバーが異種のデバイスからの寄与を非同期に使用してグローバルモデルを更新できるフレームワーク、非同期オンラインフェデレーテッドラーニング(ASO-fed)を提案する。トレーニング同期とモデルアグリゲーションを分離することで、ASO-fedはトレーニングコストを低減し、デバイスの非均質性やドロップアウトに対しても高いパフォーマンスを維持する。

ABSTRACT

Federated learning (FL) is a machine learning paradigm where a shared central model is learned across multiple distributed client devices while the training data remains on edge devices or local clients. Most prior work on federated learning uses Federated Averaging (FedAvg) as an optimization method for training in a synchronized fashion. This involves independent training at multiple edge devices with synchronous aggregation steps. However, the assumptions made by FedAvg are not realistic given the heterogeneity of devices. In particular, the volume and distribution of collected data vary in the training process due to different sampling rates of edge devices. The edge devices themselves also vary in their available communication bandwidth and system configurations, such as memory, processor speed, and power requirements. This leads to vastly different training times as well as model/data transfer times. Furthermore, availability issues at edge devices can lead to a lack of contribution from specific edge devices to the federated model. In this paper, we present an Asynchronous Online Federated Learning (ASO- fed) framework, where the edge devices perform online learning with continuous streaming local data and a central server aggregates model parameters from local clients. Our framework updates the central model in an asynchronous manner to tackle the challenges associated with both varying computational loads at heterogeneous edge devices and edge devices that lag behind or dropout. Experiments on three real-world datasets show the effectiveness of ASO-fed on lowering the overall training cost and maintaining good prediction performance.

研究の動機と目的

  • 実世界のエッジ環境における非同期フェデレーテッドアベレージング(FedAvg)の制限を解消すること。
  • 非同期アグリゲーションを可能にすることで、トレーニングコストを低減し、フェデレーテッドラーニングにおけるモデル収束を改善すること。
  • 同期サイクルに縛られない継続的オンライン学習をエッジデバイスで実現し、ストリーミングデータに対応すること。
  • 変動するデバイスの利用可能性、計算負荷、通信遅延に対しても高い予測パフォーマンスを維持すること。

提案手法

  • エッジデバイスではオンライン学習を採用し、新しいデータが到着する度にモデルを段階的に更新する。
  • 中央サーバーはクライアントからのモデル更新を非同期的にアグリゲートし、トレーニングサイクルとは独立してアグリゲーションを実行する。
  • クライアントの寄与度とタイミングに基づいて重み付けを行うことで、異なるデータ品質とデバイスの信頼性を反映する。
  • 恒久的なグローバルモデルを維持することで、デバイスのドロップアウトと変動する通信遅延を動的に処理する。
  • イベント駆動型のリアルタイムアグリゲーションを可能にするパラメータサーバーアーキテクチャを採用する。
  • 同期のボトルネックを回避することで、異なる計算能力、メモリ、帯域幅を持つ異種のエッジデバイスを効果的にサポートする。

実験結果

リサーチクエスチョン

  • RQ1フェデレーテッドラーニングにおける非同期アグリゲーションは、同期的FedAvgと比較して収束性とモデル精度にどのように影響するか?
  • RQ2エッジデバイスでのオンライン学習は、データおよびシステムの非均質性下でもトレーニング効率を向上させることができるか?
  • RQ3デバイスがドロップアウトするか、更新頻度が変動する状況下で、ASO-fedのトレーニングコストとモデルパフォーマンスはどのように変化するか?
  • RQ4実世界のエッジシナリオにおいて、非同期アグリゲーションはモデルの安定性と収束速度にどのような影響を及ぼすか?
  • RQ5ASO-fedは、異種のエッジデバイス間で変動するデータ分布と通信遅延をどのように処理するか?

主な発見

  • 同期のオーバーヘッドを排除し、変動するデバイスの利用可能性に適応することで、ASO-fedは総合的なトレーニングコストを低減する。
  • デバイスの非均質性やドロップアウトに対しても、3つの実世界データセットにおいて高い予測パフォーマンスを維持する。
  • 非同期アグリゲーションにより、同期的FedAvgと比較して収束が速く、エッジデバイスの利用効率も向上する。
  • 一部のデバイスが頻繁に寄与しない、または遅延を伴って更新する場合でも、モデルは安定したパフォーマンスを発揮する。
  • システムはストリーミングデータを効果的に処理でき、再トレーニングサイクルなしに継続的学習をサポートする。
  • 実験により、ASO-fedが現実のエッジ環境下で、トレーニング効率およびモデル精度の両面でFedAvgを上回ることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。