QUICK REVIEW

[論文レビュー] Personalizing deep learning models for automatic sleep staging

Kaare B. Mikkelsen, Maarten De Vos|arXiv (Cornell University)|Jan 8, 2018

Sleep and Wakefulness Research参考文献 6被引用数 30

ひとこと要約

本稿では、被験者の初夜睡眠データを微調整することで、事前学習済み畳み込みニューラルネットワークを被験者固有にカスタマイズする、自動睡眠ステージングのためのパーソナライズド深層学習手法を提案する。この手法により、平均で2パーセンテージポイントの性能向上が達成され、特に初回スコアが80%未満の被験者において顕著な向上が見られた。これは、広範な集団レベルの知識と被験者固有の適応を組み合わせることで、モデルのロバスト性と一般化性能が向上することを示している。

ABSTRACT

Despite continued advancement in machine learning algorithms and increasing availability of large data sets, there is still no universally acceptable solution for automatic sleep staging of human sleep recordings. One reason is that a skilled neurophysiologist scoring brain recordings of a sleeping person implicitly adapts his/her staging to the individual characteristics present in the brain recordings. Trying to incorporate this adaptation step in an automatic scoring algorithm, we introduce in this paper a method for personalizing a general sleep scoring model. Starting from a general convolutional neural network architecture, we allow the model to learn individual characteristics of the first night of sleep in order to quantify sleep stages of the second night. While the original neural network allows to sleep stage on a public database with a state of the art accuracy, personalizing the model further increases performance (on the order of two percentage points on average, but more for difficult subjects). This improvement is particularly present in subjects where the original algorithm did not perform well (typically subjects with accuracy less than $80\%$). Looking deeper, we find that optimal classification can be achieved when broad knowledge of sleep staging in general (at least 20 separate nights) is combined with subject-specific knowledge. We hypothesize that this method will be very valuable for improving scoring of lower quality sleep recordings, such as those from wearable devices.

研究の動機と目的

熟練した人間のスコアラーが自然に適応する個体差を考慮しない自動睡眠ステージングモデルのギャップを解消すること。
微調整を用いたトランスファーラーニングが、個別睡眠記録における深層学習性能を向上させることを調査すること。
集団レベルの知識と被験者固有の適応を組み合わせた際の性能向上を定量的に評価すること。
ウェアラブルデバイスからの低品質または困難な睡眠記録（例：低品質な信号）におけるこの手法の有効性を評価すること。
最小限のラベル付きデータ（例：1回のスコア付きナップ）でパーソナライズが可能である、実用的な臨床応用のシナリオを検討すること。

提案手法

1次元畳み込みニューラルネットワークを、19名の被験者からなる公的データセット（2夜分の記録）を用いて学習し、EEG（Fpz-Cz）およびEOGの導出を用いる。
各被験者の初夜データを用いて、同じネットワークアーキテクチャを維持したまま、重みを被験者固有のパターンに適応させる微調整を実施する。
予測のための入力データを、連続する3つの30秒エポック（合計90秒）に拡張し、文脈認識能力を向上させる。
各エポックを単位標準偏差に正規化し、元の標準偏差を最終全結合層への補助入力として渡す。
トランスファーラーニングを活用：まず多様なデータを用いて一般集団モデルを学習し、その後個別被験者ごとに微調整によりパーソナライズする。
標準指標を用いて2日目のデータで性能を評価し、パーソナライズなしのベースライン性能と比較する。

実験結果

リサーチクエスチョン

RQ11夜分のデータを用いて事前学習済み深層学習モデルを微調整することで、個別被験者における自動睡眠ステージングの精度を顕著に向上させることができるか？
RQ2一般モデルの性能が低い被験者（例：80%未満）において、パーソナライズがより大きな性能向上をもたらすか？
RQ3広範な集団レベルの知識と被験者固有の適忣を組み合わせることで、モデルのロバスト性と一般化性能がどの程度向上するか？
RQ4ウェアラブルデバイスからの低品質またはノイズの多い記録において、パーソナライズによる性能向上が顕著に現れるか？
RQ5最小限のラベル付きデータ（例：1回のスコア付きナップ）でパーソナライズの恩恵を得られ、実用的な臨床応用が可能になるか？

主な発見

被験者の初夜睡眠データを用いた一般モデルの微調整により、被験者集団全体で平均して約2パーセンテージポイントの精度向上が達成された。
初回スコアが80%未満の被験者において、特に性能向上が顕著で、一部のケースでは2パーセンテージポイントを超える改善が見られた。
低基準性能（例：80%未満）の被験者では最大の向上が見られ、パーソナライズが困難なケースにおけるモデルの限界を是正していることが示唆された。
少なくとも20夜分のデータから得られる広範な集団レベルの知識と、被験者固有の適応を組み合わせた場合に、分類性能が最適化された。
すでに80%以上のスコアを記録していた被験者では、微調整による性能向上が見られなかったため、このケースでは性能がインターラッパー同意基準（約83%）に近づいていると考えられる。
結果から、パーソナライズは特に低品質な記録（例：ウェアラブルデバイスからの記録）において特に価値があることが示唆された。低品質記録では通常、初期モデルの性能が低くなるためである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。