QUICK REVIEW

[논문 리뷰] FedMood: Federated Learning on Mobile Health Data for Mood Detection

Xiaohang Xu, Hao Peng|arXiv (Cornell University)|2021. 02. 06.

Mental Health Research Topics참고 문헌 31인용 수 26

한 줄 요약

FedMood는 모바일 키스트로크와 가속도계 데이터를 사용하여 기분/우울증 탐지를 위한 연합 다중 뷰 학습 프레임워크를 제시하며, 지연 융합 아키텍처를 갖추고 IID 및 비 IID 데이터 분포에서의 실험을 통해 성능 향상과 분포 민감성을 보여준다.

ABSTRACT

Depression is one of the most common mental illness problems, and the symptoms shown by patients are not consistent, making it difficult to diagnose in the process of clinical practice and pathological research. Although researchers hope that artificial intelligence can contribute to the diagnosis and treatment of depression, the traditional centralized machine learning needs to aggregate patient data, and the data privacy of patients with mental illness needs to be strictly confidential, which hinders machine learning algorithms clinical application. To solve the problem of privacy of the medical history of patients with depression, we implement federated learning to analyze and diagnose depression. First, we propose a general multi-view federated learning framework using multi-source data, which can extend any traditional machine learning model to support federated learning across different institutions or parties. Secondly, we adopt late fusion methods to solve the problem of inconsistent time series of multi-view data. Finally, we compare the federated framework with other cooperative learning frameworks in performance and discuss the related results.

연구 동기 및 목표

개인정보 보호를 강점으로 모바일 데이터를 사용해 중앙 집중화된 민감한 건강 정보를 필요로 하지 않는 기분/우울 탐지의 동기를 제시한다.
전통적 모델을 기관 간 또는 당사자 간의 연합 다중 뷰 학습으로 확장한다.
비동기 다중 뷰 시계열 데이터를 처리하기 위한 지연 융합 전략을 개발하고 평가한다.
IID 및 비 IID 데이터 분포에서의 성능을 평가하고 연합 학습과 로컬 학습 및 중앙 집중형 벤치마크를 비교한다.

제안 방법

전통 모델을 연합 설정으로 확장할 수 있는 일반적인 다중 뷰 연합 학습 프레임워크를 제안한다.
다수 뷰에서 이질적인 시계열 데이터를 정렬하고 통합하기 위한 지연 융합을 구현한다.
완전 연결 계층, 인자화 기계(Factorization Machine) 계층, 다중 뷰 기계(Multi-view Machine) 계층(DMVM/DFM/DFM)을 포함한 세 가지 융합 전략을 평가한다.
로컬 업데이트와 클라이언트 간 가중 합치를 통해 Google 스타일의 FedAvg 연합 학습을 채택한다.
SMC, 차등 프라이버시, 동형 암호화에 대한 맥락적 개요를 포함한 프라이버시 고려 사항을 도입한다.
모바일 기기 데이터(키스트로크 메타데이터 및 가속도계)를 기분 예측을 위한 커스텀 가상 키보드를 통해 수집한다.

실험 결과

연구 질문

RQ1연합 다중 뷰 학습이 모바일 헬스 데이터에서 기분 탐지에 대해 로컬 및 중앙 집중형 접근법과 비교해 어떤 성능을 보이는가?
RQ2FedMood에서 데이터 분포(IID 대 비 IID)와 클라이언트당 데이터 양의 변화가 모델 정확도에 어떤 영향을 미치는가?
RQ3다른 지연 융합 전략(완전 연결, FM, 다중 뷰 머신)은 연합 학습 설정에서 성능 차이가 있는가?
RQ4참여 당사자 수와 당사자당 데이터 양이 연합 학습의 수렴 및 정확도에 어떤 영향을 미치는가?

주요 결과

당사자 수	모델	로컬 학습	CDS	FedAVG	IIL	CIIL
4	DNN	0.7431	0.8221	0.8114	0.7909	0.8112
4	DFM	0.7514	0.8144	0.8255	0.7851	0.8107
4	DMVM	0.7343	0.7953	0.8095	0.7781	0.8098
8	DNN	0.7344	0.8294	0.8283	0.7899	0.8266
8	DFM	0.7337	0.8366	0.8266	0.7774	0.8288
8	DMVM	0.7267	0.8295	0.8156	0.7751	0.8184
12	DNN	0.7406	0.8352	0.8462	0.7971	0.8324
12	DFM	0.7444	0.8526	0.8304	0.7827	0.8360
12	DMVM	0.7238	0.8309	0.8287	0.7703	0.8409
16	DNN	0.7356	0.8463	0.8383	0.7884	0.8352
16	DFM	0.7379	0.8507	0.8388	0.8039	0.8358
16	DMVM	0.7248	0.8478	0.8281	0.7827	0.8519
24	DNN	0.7388	0.8642	0.8513	0.7945	0.8493
24	DFM	0.7455	0.8597	0.8429	0.8144	0.8487
24	DMVM	0.7240	0.8479	0.8374	0.7940	0.8529

IID 설정에서 연합 접근 방식(FedAvg 및 CIIL)은 로컬 학습 및 다른 벤치마크 대비 상당한 정확도 향상을 달성하며, IID 실험에서 DMVM으로 CIIL이 최상의 경우 약 85%의 성능을 관찰한다.
비 IID 설정에서 극단적 분포로 인해 예측 정확도가 하락하고 CDS가 일부 연합 변형들보다 우수한 경우가 많지만, CIIL 및 특정 융합 변형은 여전히 순수 로컬 학습 대비 견고한 이득을 보인다.
고정된 당사자당 데이터를 유지한 채 참여 당사자 수를 늘리면 연합 모델의 정확도가 개선되거나 안정화될 수 있으며, 이는 융합 방법과 데이터 분포에 따라 달라진다.
당사자당 로컬 데이터가 늘어나면 로컬 및 연합 성능이 일반적으로 향상되며, 특히 당사자당 데이터가 중간 규모일 때 FedAvg가 추가 이득을 제공한다(예: 수백~수천 단위의 데이터).
다중 뷰 융합(DMVM/DFM)이 여러 IID 시나리오에서 간단한 DNN 융합 전략보다 우수하게 나타날 수 있지만 비 IID 조건에서 이러한 이점이 약화될 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.