QUICK REVIEW

[논문 리뷰] Epileptic Seizure Classification Using Combined Labels and a Genetic Algorithm

Scot Davidson, Niamh McCallan|arXiv (Cornell University)|2021. 10. 04.

EEG and Brain-Computer Interfaces참고 문헌 20인용 수 8

한 줄 요약

이 논문은 템플 대학교 병원(TUH) 간질 코퍼스에서 분류 정확도를 향상시키기 위해 단순 및 복잡한 부분 간질을 하나의 집중성 발작 레이블로 통합하는 Parallel Genetic Naive Bayes Seizure Classiﬁer (PGNBSC)를 제안한다. 1.8초 EEG 세그먼트의 13개의 내재 모드 함수(IMF) 특징에서 유전 알고리즘을 사용해 특징 선택을 최적화함으로써, 이 방법은 85%의 정확도를 달성하여 기준 모델보다 유의하게 뛰어나며, 레이블 조합과 특징 최적화가 다중클래스 간질 탐지에 기여함을 입증한다.

ABSTRACT

Epilepsy affects 50 million people worldwide and is one of the most common serious neurological disorders. Seizure detection and classification is a valuable tool for diagnosing and maintaining the condition. An automated classification algorithm will allow for accurate diagnosis. Utilising the Temple University Hospital (TUH) Seizure Corpus, six seizure types are compared; absence, complex partial, myoclonic, simple partial, tonic and tonic- clonic models. This study proposes a method that utilises unique features with a novel parallel classifier - Parallel Genetic Naive Bayes (NB) Seizure Classifier (PGNBSC). The PGNBSC algorithm searches through the features and by reclassifying the data each time, the algorithm will create a matrix for optimum search criteria. Ictal states from the EEGs are segmented into 1.8 s windows, where the epochs are then further decomposed into 13 different features from the first intrinsic mode function (IMF). The features are compared using an original NB classifier in the first model. This is improved upon in a second model by using a genetic algorithm (Binary Grey Wolf Optimisation, Option 1) with a NB classifier. The third model uses a combination of the simple partial and complex partial seizures to provide the highest classification accuracy for each of the six seizures amongst the three models (20%, 53%, and 85% for first, second, and third model, respectively).

연구 동기 및 목표

기존 데이터셋의 제한적이고 불균형한 레이블링으로 인해 다중클래스 간질 발작 분류 정확도가 낮은 문제를 해결하기 위해.
단순 및 복잡한 부분 간질을 그들의 공통된 형태학적 및 임상적 특징을 바탕으로 하나의 집중성 발작 카테고리로 통합하여 분류 성능을 향상시키기 위해.
다양한 EEG 데이터에서 분류 정확도를 향상시키기 위해 유전 알고리즘(Binary Grey Wolf Optimisation)을 사용해 특징 선택을 최적화하기 위해.
여섯 가지 다른 간질 유형을 지원하는 잘 레이블링된 환자별 TUH 간질 코퍼스를 대상으로 제안된 방법을 평가하기 위해.
집중성 발작을 통합하고 병렬 분류기 아키텍처를 사용할 경우 전체 시스템의 강건성과 정확도가 향상됨을 입증하기 위해.

제안 방법

TUH 간질 코퍼스(v1.5.2)의 EEG 신호를 분석을 위해 1.8초 윈도우로 분할하였다.
실제 모드 분해(EMD)를 적용하여 첫 번째 내재 모드 함수(IMF)를 추출하고, 이로부터 시간 도메인 및 주파수 도메인 특징 13개를 추출하였다.
유전 알고리즘(Binary Grey Wolf Optimisation, Option 1)을 사용해 F1-스코어를 최대화하는 최적의 특징 조합을 탐색하는 병렬 유전 나이브 베이즈 간질 분류기(PGNBSC)를 개발하였다.
시스템은 첫 번째 및 두 번째 모델에서 여섯 개의 병렬 나이브 베이즈(NB) 분류기를 사용하고, 세 번째 모델에서는 단순 및 복잡한 부분 간질 레이블을 통합한 후 다섯 개의 분류기를 사용하였다.
정확도, F1-스코어, 혼동 행렬(히트맵)을 사용해 표준 지표를 통해 성능을 평가하였으며, 다양한 간질 유형 간 진짜 레이블과 예측 레이블을 비교하였다.
유전 알고리즘이 선택된 특징 조합을 반복적으로 사용해 데이터를 재분류함으로써, 분류 성능 향상을 위한 최적의 특징 조합 탐색을 정교화하였다.

실험 결과

연구 질문

RQ1단순 및 복잡한 부분 간질을 하나의 집중성 발작 레이블로 통합함으로써 TUH 간질 코퍼스에서 다중클래스 간질 분류 정확도가 향상되는가?
RQ2특징 선택에 유전 알고리즘을 통합할 경우, 다중클래스 EEG 기반 간질 분류 시스템의 F1-스코어와 전체 정확도에 어떤 영향을 미치는가?
RQ3여섯 가지 다른 간질 유형에서 병렬 나이브 베이즈 분류기의 성능은 레이블 통합 및 유전 최적화가 있는 경우와 없는 경우를 비교해 볼 때 어떻게 다른가?
RQ4더 작은 1.8초 EEG 윈도우와 최적화된 특징 세트를 사용할 경우, 이전의 최첨단 방법에 비해 분류 정확도가 얼마나 향상되는가?
RQ5기준 모델에 비해 제안된 방법이 토닉-클로닉 및 미오클로닉 간질과 같은 중요한 간질 유형에 대해 거짓 양성 및 거짓 음성 수를 줄이는가?

주요 결과

단순 및 복잡한 부분 간질을 하나의 집중성 발작 레이블로 통합한 세 번째 모델이 전체 정확도 85%를 기록하여 첫 번째(20%) 및 두 번째(53%) 모델보다 유의미하게 뛰어났다.
세 번째 모델에서 토닉-클로닉 간질 클래스의 참 양성 수는 두 번째 모델 대비 100% 증가했고, 거짓 양성 수는 391% 감소했다.
단순 및 복잡한 부분 간질의 병합된 거짓 양성 및 거짓 음성 비율은 세 번째 모델에서 88% 감소했으며, 병합된 참 양성 수는 1%만 감소(4667에서 4654로)하였다.
두 번째 모델에서 미오클로닉 간질 분류 성능은 첫 번째 모델 대비 400% 향상되어, 유전 최적화가 덜 흔한 간질 유형의 탐지에 크게 기여함을 시사한다.
두 번째 모델에서 토닉 간질은 가장 높은 F1-스코어(0.96)를 기록했고, 부재 간질은 F1-스코어 0.93를 기록하여 광범위한 간질 유형에서 강력한 성능을 보였다.
CHB-MIT 데이터셋에서 이전 연구가 달성한 96.79% 정확도에 못 미치지만, 제안된 방법은 더 복잡하고 실제 환자 중심의 레이블링이 풍부한 데이터셋에서 뛰어난 다중클래스 분류 성능을 달성하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.