QUICK REVIEW

[논문 리뷰] Privacy-preserving Federated Brain Tumour Segmentation

Wenqi Li, Fausto Milletarì|arXiv (Cornell University)|2019. 10. 02.

Privacy-Preserving Technologies in Data참고 문헌 11인용 수 63

한 줄 요약

논문은 BraTS 데이터에서 뇌종양 분할을 위한 개인정보 보호 연합학습 시스템을 구현·평가하고, 선택적 매개변수 공유 및 차등 개인정보 보호를 사용해 데이터 누수를 완화하면서 모멘텀 처리와 부분 모델 공유를 비교한다.

ABSTRACT

Due to medical data privacy regulations, it is often infeasible to collect and share patient data in a centralised data lake. This poses challenges for training machine learning algorithms, such as deep convolutional networks, which often require large numbers of diverse training examples. Federated learning sidesteps this difficulty by bringing code to the patient data owners and only sharing intermediate model training updates among them. Although a high-accuracy model could be achieved by appropriately aggregating these model updates, the model shared could indirectly leak the local training examples. In this paper, we investigate the feasibility of applying differential-privacy techniques to protect the patient data in a federated learning setup. We implement and evaluate practical federated learning systems for brain tumour segmentation on the BraTS dataset. The experimental results show that there is a trade-off between model performance and privacy protection costs.

연구 동기 및 목표

원시 환자 데이터를 공유하지 않고 기관 간의 공동 뇌종양 분할을 가능하게 한다.
모멘텀 기반 옵티마이저 및 불균형 클라이언트 데이터를 갖는 실용적 연합 학습 설정을 평가한다.
학습 데이터를 보호하기 위해 선택적 매개변수 공유와 차등 개인정보 보호 기법을 평가한다.
여러 기관에 걸쳐 BraTS 2018 데이터셋의 프라이버시 유틸리티 트레이드오프를 벤치마킹한다.

제안 방법

가중치가 부여된 클라이언트 업데이트를 중앙 서버가 집계하는 클라이언트-서버 연합 평균 프레임워크를 사용한다.
라운드마다 모멘텀을 재시작하는 방식과 모멘텀 용어를 유지/집계하는 방식 등 모멘텀 처리 전략을 탐색한다.
업로드되는 업데이트 일부만 공유하고 누출 위험을 줄이기 위해 클립/클립 래핑 값을 적용한다.
희소 벡터 기법을 통한 차등 개인정보 보호 모듈을 도입해 (ε1+ε2+ε3)-DP를 달성한다.
서버에서 클라이언트 업데이트를 각 클라이언트의 로컬 반복에 비례하는 가중치로 집계한다.
13기관 분할과 242개의 학습 주제로 BraTS 2018 다중 모달 MRI 데이터에 대해 평가한다.

실험 결과

연구 질문

RQ1연합 학습에서의 프라이버시 보호 기법이 중앙 집중 학습과 비교해 경쟁력 있는 분할 성능을 제공하는가?
RQ2모멘텀 처리 전략이 연합 모델 수렴 및 성능에 미치는 영향은 무엇인가?
RQ3부분 모델 공유가 프라이버시, 통신 비용 및 분할 정확도에 어떤 영향을 미치는가?
RQ4의료 영상 분할에서 차등 개인정보 보호 매개변수와 모델 성능 간의 트레이드오프는 무엇인가?

주요 결과

연합 학습은 특정 프라이버시 설정에서 중앙 집중 기준선과 동등한 분할 성능을 달성했다.
연합 라운드마다 모멘텀을 재시작하는 것이 다른 모멘텀 처리 변형들보다 우수했다.
가중 서버 집계는 불균형 다클라이언트 환경에서 간단한 평균화보다 수렴을 개선했다.
더 큰 비율의 모델 공유는 일반적으로 성능을 향상시키지만, 부분 공유(최소 40%)도 거의 기준선 결과를 얻을 수 있다.
더 강한 차등 개인정보 보호(더 높은 프라이버시 비용)는 분할 정확도를 저하시키며, 동일 DP 설정에서 40%보다 10% 모델 공유가 더 나은 성능을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.