[论文解读] EEG machine learning with Higuchi fractal dimension and Sample Entropy as features for successful detection of depression
本研究提出了一种机器学习框架,利用脑电图(EEG)信号中提取的非线性特征——Higuchi分形维数(HFD)和样本熵(SampEn),以检测抑郁症。采用七种分类器,该方法实现了90.24%至97.56%的准确率,表明SampEn优于HFD,且少量主成分即可实现对抑郁症患者与健康对照组的高区分度。
Reliable diagnosis of depressive disorder is essential for both optimal treatment and prevention of fatal outcomes. In this study, we aimed to elucidate the effectiveness of two non-linear measures, Higuchi Fractal Dimension (HFD) and Sample Entropy (SampEn), in detecting depressive disorders when applied on EEG. HFD and SampEn of EEG signals were used as features for seven machine learning algorithms including Multilayer Perceptron, Logistic Regression, Support Vector Machines with the linear and polynomial kernel, Decision Tree, Random Forest, and Naive Bayes classifier, discriminating EEG between healthy control subjects and patients diagnosed with depression. We confirmed earlier observations that both non-linear measures can discriminate EEG signals of patients from healthy control subjects. The results suggest that good classification is possible even with a small number of principal components. Average accuracy among classifiers ranged from 90.24% to 97.56%. Among the two measures, SampEn had better performance. Using HFD and SampEn and a variety of machine learning techniques we can accurately discriminate patients diagnosed with depression vs controls which can serve as a highly sensitive, clinically relevant marker for the diagnosis of depressive disorders.
研究动机与目标
- 评估非线性EEG特征——Higuchi分形维数(HFD)和样本熵(SampEn)——在区分抑郁症患者与健康对照组EEG信号方面的有效性。
- 评估多种机器学习算法在使用HFD和SampEn特征进行抑郁症分类时的性能表现。
- 确定从这些特征中提取的主成分数量是否足够维持高分类准确率。
- 确定HFD和SampEn是否可作为临床相关、敏感的生物标志物用于抑郁症诊断。
提出的方法
- 从EEG时间序列计算Higuchi分形维数(HFD),以量化信号的复杂性和分形特性。
- 计算样本熵(SampEn),以评估EEG信号的规律性和不可预测性。
- 从抑郁症患者和健康对照组的EEG记录中提取结合HFD和SampEn值的特征向量。
- 应用主成分分析(PCA)以降低维度,同时保留判别性信息。
- 在降维后的特征集上训练并评估七种机器学习分类器——多层感知机、逻辑回归、线性核与多项式核支持向量机(SVM)、决策树、随机森林和朴素贝叶斯。
- 通过准确率评估分类性能,并采用交叉验证以确保结果的稳健性。
实验结果
研究问题
- RQ1Higuchi分形维数与样本熵是否能有效区分抑郁症患者与健康对照组的EEG信号?
- RQ2当使用HFD和SampEn作为输入特征时,哪种机器学习算法在抑郁症检测中表现最佳?
- RQ3使用这些非线性EEG特征时,需要多少个主成分才能维持高分类准确率?
- RQ4样本熵在区分与抑郁症相关的EEG模式方面是否优于Higuchi分形维数?
主要发现
- HFD与SampEn特征的组合在七种机器学习模型中实现了90.24%至97.56%的分类准确率。
- 样本熵在区分抑郁症患者与对照组的EEG信号方面表现出优于Higuchi分形维数的性能。
- 即使仅使用少量主成分,仍能维持高分类准确率,表明在低维特征表示下具有强大的判别能力。
- 结果证实,HFD与SampEn均为检测EEG动力学中与抑郁症相关变化的有效非线性度量。
- 本研究确立了HFD与SampEn作为使用EEG和机器学习进行抑郁症诊断的高敏感性、临床相关生物标志物。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。