QUICK REVIEW

[논문 리뷰] Split Learning for collaborative deep learning in healthcare

Maarten G. Poirot, Praneeth Vepakomma|arXiv (Cornell University)|2019. 12. 27.

Machine Learning in Healthcare참고 문헌 23인용 수 82

한 줄 요약

나눠진 학습이 여러 의료기관 간 협력적 딥러닝을 가능하게 하며, 중앙집중식 또는 비협력적 설정과 비교해 유사하거나 우수한 성능을 달성하고, 망막 및 흉부 X-레이 작업에 걸쳐 클라이언트 수가 증가해도 이점이 지속된다.

ABSTRACT

Shortage of labeled data has been holding the surge of deep learning in healthcare back, as sample sizes are often small, patient information cannot be shared openly, and multi-center collaborative studies are a burden to set up. Distributed machine learning methods promise to mitigate these problems. We argue for a split learning based approach and apply this distributed learning method for the first time in the medical field to compare performance against (1) centrally hosted and (2) non collaborative configurations for a range of participants. Two medical deep learning tasks are used to compare split learning to conventional single and multi center approaches: a binary classification problem of a data set of 9000 fundus photos, and multi-label classification problem of a data set of 156,535 chest X-rays. The several distributed learning setups are compared for a range of 1-50 distributed participants. Performance of the split learning configuration remained constant for any number of clients compared to a single center study, showing a marked difference compared to the non collaborative configuration after 2 clients (p < 0.001) for both sets. Our results affirm the benefits of collaborative training of deep neural networks in health care. Our work proves the significant benefit of distributed learning in healthcare, and paves the way for future real-world implementations.

연구 동기 및 목표

의료 분야의 딥러닝에서 데이터 부족 및 프라이버시 문제를 동기화하고 해결한다.
의료 환경에 적합한 분할 학습(U자형) 프레임워크를 제안한다.
의료 영상 작업에서 분할 학습을 중앙집중식 및 비협력 기반선과 비교 평가한다.
1-50명의 분산 참여자에 걸친 확장성을 평가하고 성능 안정성을 분석한다.

제안 방법

세 가지 링크(전면 로컬, 중앙 중심, 후면 로컬)가 있는 U자형 분할 학습 구성을 적용한다.
원시 데이터나 레이블을 공유하지 않고 클라이언트를 순차적으로 학습시키며, 클라이언트를 전환할 때 로컬 상태를 전이한다.
당뇨병망막증에는 Resnet-34, CheXpert에는 DenseNet-121를 사용하고 표준 Adam 최적화를 적용한다.
성능을 중앙 집중식 학습 및 비협력 학습과 비교하며, 정확도( DR ) 및 AUROC(CheXpert)을 평가한다.
데이터를 75% 학습/25% 검증으로 분할하고, 클라이언트 간 데이터가 동일하며 환자 중복이 없다.
협업 모드에서 클라이언트당 한 에포크를 수행하고, 비협력 모드는 협업 설정의 데이터 크기를 반영한다.

실험 결과

연구 질문

RQ1분할 학습이 의료 영상 작업에서 중앙집중식 학습과 비슷한 성능을 보이는가?
RQ2분산 참여자 수를 증가시켰을 때 분할 학습을 통한 협력이 어떻게 확장되는가(1-50)?
RQ3작업 및 클라이언트 수에 따라 분할 학습과 비협력 학습 간 성능 차이는 어느 정도인가?
RQ4의료 분야에서 U자형 분할 학습 구성이 프라이버시 및 대역폭에 어떤 함의를 가지는가?
RQ5비의료 설정에서 다른 분산 접근 방식과 비교해 분할 학습의 성능은 어떠한가?

주요 결과

클라이언트 수	Split learning 평균 (DR)	비협력 평균 (DR)
1	0.888 (0.896, 0.880)	0.869 (0.877, 0.861)
2	0.850 (0.857, 0.843)	0.852 (0.865, 0.839)
3	0.868 (0.875, 0.861)	0.753 (0.766, 0.742)
4	0.884 (0.891, 0.878)	0.754 (0.770, 0.739)
5	0.869 (0.877, 0.861)	0.755 (0.772, 0.738)
8	0.887 (0.894, 0.880)	0.717 (0.733, 0.701)
10	0.858 (0.868, 0.849)	0.676 (0.695, 0.657)
15	0.838 (0.848, 0.829)	0.627 (0.649, 0.603)
20	0.860 (0.868, 0.852)	0.613 (0.632, 0.594)
25	0.850 (0.858, 0.841)	0.607 (0.627, 0.588)
30	0.814 (0.831, 0.797)	0.620 (0.648, 0.590)
35	0.798 (0.819, 0.780)	0.633 (0.656, 0.611)
40	0.852 (0.859, 0.844)	0.595 (0.619, 0.568)
45	0.883 (0.891, 0.876)	0.608 (0.634, 0.581)
50	0.859 (0.869, 0.849)	0.588 (0.611, 0.565)

분할 학습은 두 데이터 세트 모두에서 비협력 학습보다 일관되게 우수한 성능을 보였다.
CheXpert에서 비협력 설정의 평균 성능은 클라이언트가 2명 초과일 때 협력 설정에 비해 현저히 낮았으며(p<0.005).
DR 결과는 1-50명 클라이언트에서 분할 학습이 안정적이며, 클라이언트 수가 증가할수록 비협력 구성보다 더 높은 정확도를 보였다.
표 1은 DR 결과를 보고하며, 1명의 클라이언트에서는 분할 학습 = 0.888, 비협력 = 0.869; 2명 클라이언트에서는 0.850 대 0.852; 그 이후 클라이언트 수가 많아져도 분할 학습은 경쟁력을 유지한다(표의 값 참조).
CheXpert 결과는 다섯 가지 작업에 대해 AUROC를 사용하며, 분할 학습이 비협력 구성보다 우수하며, 클라이언트 수가 증가함에 따라 유의한 차이가 나타난다.
본 연구는 의료 분야의 분산 학습이 분할 학습을 통해 의미 있는 성능 향상을 제공하고 향후 실제 현장 구현을 뒷받침한다고 결론짓는다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.