QUICK REVIEW

[논문 리뷰] Personalizing deep learning models for automatic sleep staging

Kaare B. Mikkelsen, Maarten De Vos|arXiv (Cornell University)|2018. 01. 08.

Sleep and Wakefulness Research참고 문헌 6인용 수 30

한 줄 요약

이 논문은 개인화된 딥러닝 접근법을 제안하여, 한 명의 환자의 첫 번째 밤 수면 데이터를 기반으로 미리 훈련된 합성곱 신경망을 미세조정하여 두 번째 밤의 수면 단계 분류 정확도를 향상시키는 방법을 제시한다. 이 방법은 평균적으로 정확도를 최대 2%p 향상시키며, 특히 초반에 80% 이하의 성능을 보였던 환자들에게서 두드러진 성능 향상을 보여주어, 광범위한 인구집단 지식과 개인별 적응을 융합함으로써 모델의 강건성과 일반화 능력이 향상됨을 입증한다.

ABSTRACT

Despite continued advancement in machine learning algorithms and increasing availability of large data sets, there is still no universally acceptable solution for automatic sleep staging of human sleep recordings. One reason is that a skilled neurophysiologist scoring brain recordings of a sleeping person implicitly adapts his/her staging to the individual characteristics present in the brain recordings. Trying to incorporate this adaptation step in an automatic scoring algorithm, we introduce in this paper a method for personalizing a general sleep scoring model. Starting from a general convolutional neural network architecture, we allow the model to learn individual characteristics of the first night of sleep in order to quantify sleep stages of the second night. While the original neural network allows to sleep stage on a public database with a state of the art accuracy, personalizing the model further increases performance (on the order of two percentage points on average, but more for difficult subjects). This improvement is particularly present in subjects where the original algorithm did not perform well (typically subjects with accuracy less than $80\%$). Looking deeper, we find that optimal classification can be achieved when broad knowledge of sleep staging in general (at least 20 separate nights) is combined with subject-specific knowledge. We hypothesize that this method will be very valuable for improving scoring of lower quality sleep recordings, such as those from wearable devices.

연구 동기 및 목표

숙련된 인간 평가자가 자연스럽게 적응하는 개인별 주체 변동성을 반영하지 못하는 자동 수면 단계 분류 모델의 격차를 해결하기 위해.
전이 학습과 미세조정을 활용하여 개별 수면 기록에서 딥러닝 성능을 향상시킬 수 있는지 탐구하기 위해.
수면 단계 분류에서 일반 인구집단 수준의 지식과 개인별 적응을 융합함으로써 얻는 성능 향상 정도를 정량화하기 위해.
웨어러블 기기에서 기록된 저품질 또는 곤란한 수면 기록과 같은 환경에서 이 방법의 효과성을 평가하기 위해.
최소한의 레이블이 부여된 데이터(예: 단일 나프)로도 개인화가 가능해 실용적인 임상 현장 적용이 가능한지를 탐색하기 위해.

제안 방법

19명의 주체가 포함된 공개 데이터셋(두 번의 밤 기록 포함)을 기반으로, EEG(Fpz-Cz) 및 EOG 유도를 사용하여 1D 합성곱 신경망을 훈련시켰다.
각 주체의 첫 번째 밤 데이터를 기반으로 동일한 네트워크 아키텍처를 유지하면서 가중치를 개인별 패턴에 맞게 조정하여 모델을 미세조정하였다.
예측 성능 향상을 위해 각 예측에 대해 연속된 3개의 30초 에포크(총 90초)를 입력 데이터로 포함시켰다.
각 에포크는 단위 표준편차로 정규화되었으며, 원래의 표준편차 값은 최종 완전히 연결된 레이어에 보조 입력으로 전달되었다.
모델는 전이 학습을 활용한다: 먼저 다양한 데이터를 기반으로 일반 인구집단 모델을 훈련한 후, 각 주체별로 미세조정을 통해 개인화하였다.
성능 평가는 두 번째 밤의 데이터를 기반으로 표준 지표를 사용하여 평가하였으며, 개인화 없이 기준 성능과의 비교도 수행하였다.

실험 결과

연구 질문

RQ1단일 밤의 데이터를 기반으로 사전 훈련된 딥러닝 모델을 미세조정함으로써 개인 주체의 자동 수면 단계 분류 정확도를 크게 향상시킬 수 있는가?
RQ2일반 모델이 성능이 열악한 주체들(예: 80% 이하 정확도)에서 개인화가 더 큰 성능 향상을 가져오는가?
RQ3광범위한 인구집단 수준의 지식과 개인별 적응을 융합함으로써 모델의 강건성과 일반화 능력이 어느 정도 향상되는가?
RQ4웨어러블 기기에서 기록된 저품질 또는 노이즈가 많은 기록에서는 개인화로 인한 성능 향상이 더 두드러지는가?
RQ5최소한의 레이블이 부여된 데이터(예: 단일 스크로링 나프)로도 개인화 성과를 달성할 수 있으며, 이는 실용적인 임상 현장 적용 가능성을 높이는가?

주요 결과

주체의 첫 번째 밤 수면 데이터를 기반으로 일반 모델을 미세조정함으로써 코hort 전체에서 평균 정확도가 약 2%p 향상되었다.
초기 성능가가 80% 이하였던 주체들에서 성능 향상이 가장 두드러졌으며, 일부 사례에서는 2%p 이상의 향상이 관찰되었다.
기본 성능가가 낮았던 주체들(예: <80%)이 가장 큰 성능 향상을 보였으며, 이는 개인화가 어려운 케이스에서 모델의 한계를 보완함을 시사한다.
최소 20건 이상의 밤 기록에서 유도된 광범위한 인구집단 수준의 지식과 개인별 적응을 융합할 때 분류 성능가 최적화되었다.
이미 80% 이상의 성능을 보였던 주체들에서는 미세조정이 성능 향상에 기여하지 않았으며, 이는 이러한 케이스에서 성능가가 이미 상호 평가 일치 기준(~83%)에 수렴하고 있음을 시사한다.
결과적으로 개인화가 웨어러블 기기에서 기록된 저품질 기록과 같은 환경에서 특히 유용하며, 초기 모델 성능가가 일반적으로 낮은 경우에 효과적임을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.