[论文解读] Automatic Sleep Stage Scoring with Single-Channel EEG Using Convolutional Neural Networks
本论文训练CNN在单通道EEG上进行自动睡眠阶段评分,无需手工特征,在公开数据集上进行20折交叉验证,获得竞争性的平均F1、各阶段精准度以及总体准确率。
We used convolutional neural networks (CNNs) for automatic sleep stage scoring based on single-channel electroencephalography (EEG) to learn task-specific filters for classification without using prior domain knowledge. We used an openly available dataset from 20 healthy young adults for evaluation and applied 20-fold cross-validation. We used class-balanced random sampling within the stochastic gradient descent (SGD) optimization of the CNN to avoid skewed performance in favor of the most represented sleep stages. We achieved high mean F1-score (81%, range 79-83%), mean accuracy across individual sleep stages (82%, range 80-84%) and overall accuracy (74%, range 71-76%) over all subjects. By analyzing and visualizing the filters that our CNN learns, we found that rules learned by the filters correspond to sleep scoring criteria in the American Academy of Sleep Medicine (AASM) manual that human experts follow. Our method's performance is balanced across classes and our results are comparable to state-of-the-art methods with hand-engineered features. We show that, without using prior domain knowledge, a CNN can automatically learn to distinguish among different normal sleep stages.
研究动机与目标
- 在不依赖先验领域知识的情况下,动机驱动使用深度学习进行自动睡眠阶段评分。
- 开发可以直接对原始单通道EEG信号进行处理的CNN。
- 缓解类别不平衡,确保各睡眠阶段的性能更均衡。
- 用跨受试者验证评估泛化性,并对睡眠质量和转变时段进行鲁棒性分析。
提出的方法
- 提出一个两阶段的CNN架构,包含两个卷积-池化块、一个堆叠层以及两个全连接层,输入到一个softmax分类器。
- 输入来自Fpz-Cz的原始EEG(在100 Hz下一个30 s的时段有15000个时间点),不做预处理。
- 在SGD过程中按时段进行类别平衡的随机采样以缓解类别不平衡。
- 使用20折交叉验证进行训练和评估,每一折测试一个受试者,其余19个用于训练。
- 通过频率内容和激活模式分析学习到的CNN滤波器,以与AASM手动指南进行比较。
- 将端到端CNN的性能与先前的手工特征方法以及固定滤波器(M-CNN)变体进行比较。
实验结果
研究问题
- RQ1CNN是否能够从原始单通道EEG中学习到区分睡眠阶段的特征,而无需手工设计的特征?
- RQ2在类别不平衡下,端到端CNN睡眠分期是否能够在所有睡眠阶段之间实现性能平衡?
- RQ3跨折叠中,CNN学习的滤波器如何与既定睡眠评分标准(AASM)相关?
- RQ4基于CNN的睡眠分期在跨受试者以及对不同睡眠质量和转变速率的泛化能力如何?
主要发现
- 五个阶段的平均F1分数:约79–81%,具体取决于指标和折叠。
- 每阶段平均准确率约80–82%;总体准确率约74%。
- 最佳识别阶段为N3(约90%正确),REM和N2约为75%上下,Wake约70%的总体准确率。
- 错误分类最常见的是N1与W或N1与R之间;其他阶段对之间的混淆相对较低。
- CNN学习的一层滤波器显示出频率模式(例如,N3为1–1.5 Hz与12.5–14 Hz,N2为13–14.5 Hz与2–4 Hz),这些与AASM指南一致,表明学习到的特征易于解释。
- 跨5折学习到的滤波器显示出较高层次的相似性,表明学习到的表示在数据分割中的一致性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。