QUICK REVIEW

[论文解读] Epileptic Seizure Classification Using Combined Labels and a Genetic Algorithm

Scot Davidson, Niamh McCallan|arXiv (Cornell University)|Oct 4, 2021

EEG and Brain-Computer Interfaces参考文献 20被引用 8

一句话总结

本文提出了一种并行遗传朴素贝叶斯癫痫发作分类器（PGNBSC），将简单部分性发作和复杂部分性发作合并为单一的局灶 onset 标签，以提升在坦普尔大学医院（TUH）癫痫发作语料库上的分类准确率。通过使用遗传算法从1.8秒EEG片段的13个固有模态函数（IMF）特征中优化特征选择，该方法实现了85%的准确率，显著优于基线模型，表明标签合并与特征优化可提升多类癫痫发作检测的性能。

ABSTRACT

Epilepsy affects 50 million people worldwide and is one of the most common serious neurological disorders. Seizure detection and classification is a valuable tool for diagnosing and maintaining the condition. An automated classification algorithm will allow for accurate diagnosis. Utilising the Temple University Hospital (TUH) Seizure Corpus, six seizure types are compared; absence, complex partial, myoclonic, simple partial, tonic and tonic- clonic models. This study proposes a method that utilises unique features with a novel parallel classifier - Parallel Genetic Naive Bayes (NB) Seizure Classifier (PGNBSC). The PGNBSC algorithm searches through the features and by reclassifying the data each time, the algorithm will create a matrix for optimum search criteria. Ictal states from the EEGs are segmented into 1.8 s windows, where the epochs are then further decomposed into 13 different features from the first intrinsic mode function (IMF). The features are compared using an original NB classifier in the first model. This is improved upon in a second model by using a genetic algorithm (Binary Grey Wolf Optimisation, Option 1) with a NB classifier. The third model uses a combination of the simple partial and complex partial seizures to provide the highest classification accuracy for each of the six seizures amongst the three models (20%, 53%, and 85% for first, second, and third model, respectively).

研究动机与目标

为解决现有数据集中标签有限且不平衡导致多类癫痫发作分类准确率低下的挑战。
通过将简单部分性发作与复杂部分性发作合并为单一的局灶 onset 癫痫发作类别，利用其共有的形态学与临床特征，提升分类性能。
使用遗传算法（二进制灰狼优化）优化特征选择，以提升EEG数据的分类准确率。
在标注良好、患者特异性的TUH癫痫发作语料库上评估所提方法，该语料库支持六种不同的癫痫发作类型。
证明将局灶 onset 癫痫发作合并并采用并行分类器架构可提升整体系统的鲁棒性与准确率。

提出的方法

从TUH癫痫发作语料库（v1.5.2）中提取EEG信号，并将其分割为1.8秒的窗口以供分析。
应用经验模态分解（EMD）以提取首个固有模态函数（IMF），并从中提取13个时域与频域特征。
开发了并行遗传朴素贝叶斯癫痫发作分类器（PGNBSC），利用遗传算法（二进制灰狼优化，选项1）搜索能最大化F1-score的最优特征子集。
系统在前两个模型中采用六个并行朴素贝叶斯（NB）分类器，在第三个模型中将简单与复杂部分性发作标签合并后，使用五个分类器。
采用标准指标评估性能：准确率、F1-score以及混淆矩阵（热力图），以比较不同癫痫发作类型的真实标签与预测标签。
遗传算法通过迭代使用选定的特征子集重新分类数据，持续优化以寻找能提升分类性能的最优特征组合。

实验结果

研究问题

RQ1能否将简单与复杂部分性发作合并为单一的局灶 onset 标签，以提升在TUH癫痫发作语料库上的多类癫痫发作分类准确率？
RQ2将遗传算法用于特征选择，对多类EEG基癫痫发作分类系统的F1-score与整体准确率有何影响？
RQ3在六种不同癫痫发作类型上，并行朴素贝叶斯分类器在标签合并与遗传优化前后，性能表现如何比较？
RQ4相较于使用更大窗口或未优化特征的先前最先进方法，采用更小的1.8秒EEG窗口与优化特征集，在多大程度上提升了分类准确率？
RQ5与基线模型相比，所提方法是否降低了关键癫痫发作类型（如强直-阵挛性与肌阵挛性发作）的假阳性和假阴性率？

主要发现

第三个模型将简单与复杂部分性发作合并为单一的局灶 onset 标签，实现了85%的最高整体准确率，显著优于第一（20%）和第二（53%）个模型。
与第二模型相比，第三模型中强直-阵挛性发作类别的真正例增加了100%，假正例减少了391%。
尽管合并真正例数量仅下降1%（从4667降至4654），但第三模型中简单与复杂部分性发作的合并假阳性和假阴性率降低了88%。
与第一模型相比，第二模型中肌阵挛性发作的分类性能提升了400%，表明遗传优化显著增强了对较少见癫痫发作类型的检测能力。
在第二模型中，强直性发作的F1-score达到最高值（0.96），而失神发作的F1-score为0.93，表明对全面性发作类型具有优异性能。
尽管未达到先前在CHB-MIT数据集上96.79%的准确率，但本方法在更复杂、真实世界且标注详尽、患者特异性的数据集上实现了更优的多类分类性能。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。