Skip to main content
QUICK REVIEW

[論文レビュー] Multi-site fMRI Analysis Using Privacy-preserving Federated Learning and Domain Adaptation: ABIDE Results

Xiaoxiao Li, Yufeng Gu|arXiv (Cornell University)|Jan 16, 2020
Privacy-Preserving Technologies in Data参考文献 50被引用数 27
ひとこと要約

本論文は、ABIDEデータセットを用いた多施設fMRI解析のためのプライバシー保護型フェデレーテッドラーニングフレームワークを提案し、生データの共有を回避しながら共同学習を可能にしている。ランダム化されたモデル重み集約と2つのドメイン適応手法(MoEと敵対的アライメント)を組み合わせることで、ASDとHCの分類精度が向上し、患者のプライバシーを保護するとともに、施設間のデータ分布のずれに対処している。

ABSTRACT

Deep learning models have shown their advantage in many different tasks, including neuroimage analysis. However, to effectively train a high-quality deep learning model, the aggregation of a significant amount of patient information is required. The time and cost for acquisition and annotation in assembling, for example, large fMRI datasets make it difficult to acquire large numbers at a single site. However, due to the need to protect the privacy of patient data, it is hard to assemble a central database from multiple institutions. Federated learning allows for population-level models to be trained without centralizing entities' data by transmitting the global model to local entities, training the model locally, and then averaging the gradients or weights in the global model. However, some studies suggest that private information can be recovered from the model gradients or weights. In this work, we address the problem of multi-site fMRI classification with a privacy-preserving strategy. To solve the problem, we propose a federated learning approach, where a decentralized iterative optimization algorithm is implemented and shared local model weights are altered by a randomization mechanism. Considering the systemic differences of fMRI distributions from different sites, we further propose two domain adaptation methods in this federated learning formulation. We investigate various practical aspects of federated model optimization and compare federated learning with alternative training strategies. Overall, our results demonstrate that it is promising to utilize multi-site data without data sharing to boost neuroimage analysis performance and find reliable disease-related biomarkers. Our proposed pipeline can be generalized to other privacy-sensitive medical data analysis problems.

研究の動機と目的

  • プライバシーおよび規制上の制約により、大規模なデータが機関間で断片化している状況において、fMRIを用いた神経画像解析のための高精度なディープラーニングモデルを訓練する課題に対処すること。
  • 生fMRIデータの中央集権的集約を回避することで、患者のプライバシーを保護するフェデレーテッドラーニングフレームワークを構築すること。特に、再構成攻撃を防ぐために、ランダム化されたモデル重み更新を用いる。
  • スキャンプロトコル、機器、被検者への指示の違いによって引き起こされるドメインシフトを軽減し、モデルの一般化性能を向上させること。
  • 自閉症スペクトラム症候群(ASD)と健常対照群(HC)を分類する際の、フェデレーテッドラーニングにドメイン適応を組み合わせた手法の性能を、他の訓練戦略と比較して評価すること。
  • 分散型でプライバシー保護型のディープラーニングパイプラインを用いて、ASDの信頼性の高い機能的結合バイオマーカーを同定すること。

提案手法

  • 現地で施設固有のfMRIデータを用いてローカルモデルを学習する分散型フェデレーテッドラーニング設定を実装し、グローバルモデル重みをローカル勾配または重みの平均化によって更新する。
  • 共有されるモデル重みにランダム化機構を適用し、プライバシー漏洩を防ぐ。具体的には、モデル逆転攻撃や再構成攻撃に対する防御として、ノイズ注入を用いる。
  • 施設固有のエキスパートとルーティングネットワークを学習する混合エキスパート(MoE)ドメイン適応手法を導入し、複数施設の予測を適応的に統合する。
  • 敵対的ドメインアライメントを適用し、ドメイン識別器を用いてドメイン差を最小化することで、異なる施設の潜在表現をアライメントさせる。
  • 複数のモデルの予測を統合するアンサンブル戦略を採用し、モデルのロバスト性と性能を向上させる。
  • 多施設fMRIデータセット(ABIDE)を用い、クロスサイト検証を実施し、標準指標(正確度、AUC、F1スコア)を用いてモデル性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1プライバシー保護メカニズムを備えたフェデレーテッドラーニングは、生データの共有なしにfMRIベースのASD分類のためのディープラーニングモデルを有効に訓練できるか?
  • RQ2MoEおよび敵対的アライメントといったドメイン適応技術の導入が、複数施設の異種fMRIデータに対してモデル性能をどのように向上させるか?
  • RQ3通信頻度とモデルランダム化が、多施設fMRI環境下でのモデル精度とプライバシー保護に与える影響は何か?
  • RQ4提案されたフェデレーテッドラーニングフレームワークは、複数施設に一般化可能な信頼性の高い機能的結合バイオマーカーを同定できるか?
  • RQ5ドメイン適応は、フェデレーテッドfMRI解析においてどのような条件下で性能向上をもたらすか?

主な発見

  • プライバシー保護型ランダム化を組み合わせた提案されたフェデレーテッドラーニングフレームワークは、中央集権的学習と同等の分類性能を達成した。これは、高精度なモデル精度を実現するためのデータ共有が必須ではないことを示している。
  • ドメイン適応手法、特にMoEと敵対的アライメントは、4施設中2施設で分類精度を向上させた。一方、1施設では性能が維持され、1施設では改善が見られなかった。これは、ドメイン適応の効果が状況依存的であることを示している。
  • 通信頻度(グローバルモデル更新の頻度)は、テスト範囲内でモデル性能に顕著な影響を及ぼさなかった。これは、現在の設定においてこのハイパーパrameterに対してモデルが頑健であることを示している。
  • モデルは、後頭回、外側頭回、および楔状回などの領域で一貫した活性化を示す脳の機能的結合パターンを同定した。これらはASDの潜在的バイオマーカーとしての可能性を示している。
  • アンサンブル手法の適用により、個々のモデルよりも性能が向上した。スタッキングや勾配ブースティングといったより高度なアンサンブル技術を用いることで、さらなる性能向上が期待できる。
  • 本研究は、ドメイン適応を組み合わせたフェデレーテッドラーニングが、患者コhortが限られる希少疾患の神経画像研究において、実用的かつプライバシー保護型の代替手段であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。