QUICK REVIEW

[論文レビュー] Privacy-preserving Federated Brain Tumour Segmentation

Wenqi Li, Fausto Milletarì|arXiv (Cornell University)|Oct 2, 2019

Privacy-Preserving Technologies in Data参考文献 11被引用数 63

ひとこと要約

この論文は、BraTSデータを用いた脳腫瘍セグメンテーションのためのプライバシー保護型フェデレーテッド学習システムを実装・評価し、データ漏洩を軽減するために選択的パラメータ共有と差分プライバシーを用い、モーメンタム処理と部分的モデル共有を比較しています。

ABSTRACT

Due to medical data privacy regulations, it is often infeasible to collect and share patient data in a centralised data lake. This poses challenges for training machine learning algorithms, such as deep convolutional networks, which often require large numbers of diverse training examples. Federated learning sidesteps this difficulty by bringing code to the patient data owners and only sharing intermediate model training updates among them. Although a high-accuracy model could be achieved by appropriately aggregating these model updates, the model shared could indirectly leak the local training examples. In this paper, we investigate the feasibility of applying differential-privacy techniques to protect the patient data in a federated learning setup. We implement and evaluate practical federated learning systems for brain tumour segmentation on the BraTS dataset. The experimental results show that there is a trade-off between model performance and privacy protection costs.

研究の動機と目的

生データである患者データを共有せずに、機関間で協調的な脳腫瘍セグメンテーションを実現する。
モーメンタムベースの最適化手法と不均衡なクライアントデータを含む実用的なフェデレーテッド学習設定を評価する。
フェデレーテッドラーニングにおける学習データを保護するための選択的パラメータ共有と差分プライバシー技術を評価する。
複数の機関にまたがるBraTS 2018データセットで、プライバシーと有用性のトレードオフをベンチマークする。

提案手法

重み付きクライアント更新を集中サーバが集約するクライアント-サーバー型フェデレーテッド平均化フレームワークを使用する。
各ラウンドでモーメンタムを再起動する方式と、モーメンタム項を維持・集約する方式を含むモーメンタム処理戦略を検討する。
更新の一部のみをアップロードする選択的パラメータ共有を適用し、リークリスクを低減するためにクリップまたはクリップでラップされた値を用いる。
スパースベクタ技法を介して差分プライバシーモジュールを組み込み、(ε1+ε2+ε3)-DPを達成する。
各クライアントの局所反復回数に比例した重みでサーバ上でクライアント更新を集約する。
13機関分割と242のトレーニング対象を持つBraTS 2018の多モーダルMRIデータで評価する。

実験結果

リサーチクエスチョン

RQ1フェデレーテッドラーニングにおけるプライバシー保護技術は、中央集権的な訓練と比較して競争力のあるセグメンテーション性能を提供できるか。
RQ2モーメンタム処理戦略がフェデレーテッドモデルの収束と性能に与える影響はどのようなものか。
RQ3部分的なモデル共有がプライバシー、通信コスト、セグメンテーション精度に与える影響はどうなるか。
RQ4医用画像セグメンテーションにおける差分プライバシーパラメータとモデル性能のトレードオフは何か。

主な発見

特定のプライバシー設定下で、フェデレーテッド学習は集中基準と同等のセグメンテーション性能を達成した。
各フェデレーテッドラウンドでモーメンタムを再起動する方が、他のモーメンタム処理のバリアントより優れていた。
重み付けによるサーバ集約は、不均衡なマルチクライアント設定で単純な平均化より収束を改善した。
モデルのより大きな部分を共有するほど一般に性能が向上するが、部分共有（40%程度まで）でもほぼベースラインの結果を得られる。
より強い差分プライバシー（より高いプライバシーコスト）はセグメンテーション精度を低下させ、同じDP設定下では40%よりも10%のモデル共有の方が性能が良い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。