Skip to main content
QUICK REVIEW

[論文レビュー] Deep Feature Mining via Attention-based BiLSTM-GCN for Human Motor Imagery Recognition

Yimin Hou, Shuyue Jia|arXiv (Cornell University)|May 2, 2020
EEG and Brain-Computer Interfaces参考文献 49被引用数 32
ひとこと要約

本論文は、0.4sのサンプルを用いて EEG motor imagery をデコードする Attention-based BiLSTM-GCN フレームワークを提案し、グループレベルおよび個体レベルで最新の精度を達成した。

ABSTRACT

Recognition accuracy and response time are both critically essential ahead of building practical electroencephalography (EEG) based brain-computer interface (BCI). Recent approaches, however, have either compromised in the classification accuracy or responding time. This paper presents a novel deep learning approach designed towards remarkably accurate and responsive motor imagery (MI) recognition based on scalp EEG. Bidirectional Long Short-term Memory (BiLSTM) with the Attention mechanism manages to derive relevant features from raw EEG signals. The connected graph convolutional neural network (GCN) promotes the decoding performance by cooperating with the topological structure of features, which are estimated from the overall data. The 0.4-second detection framework has shown effective and efficient prediction based on individual and group-wise training, with 98.81% and 94.64% accuracy, respectively, which outperformed all the state-of-the-art studies. The introduced deep feature mining approach can precisely recognize human motion intents from raw EEG signals, which paves the road to translate the EEG based MI recognition to practical BCI systems.

研究の動機と目的

  • 実用的なBCIのために、試行間および被験者間のばらつきに対処し、迅速かつ正確な EEGベースの MI 認識を動機づける。
  • 生データ64チャンネルの EEG から頑健な特徴を学習する深層学習パイプラインを開発する。
  • グラフベースの学習を通じてデコードを強化するため、トポロジカルな特徴構造を活用する。
  • グループ別および被験者固有の評価を通じて頑健性と再現性を示す。

提案手法

  • 入力として、64チャンネル EEG 信号を0.4秒のセグメントに分割(64x64)して使用する。
  • 生データ EEG から空間-時間特徴を抽出するために Attention 機構を備えた BiLSTM を適用する。
  • 抽出された特徴のグラフ表現を Pearson、absolute Pearson、adjacency、Laplacian 行列を用いて構築する。
  • プーリングとソフトマックス出力を備えた6層の Graph Convolutional Network (GCN) によって、グラフ構造化された特徴を分類する。
  • ドロップアウト、バッチ正規化、クロスエントロピー損失を用いて TensorFlow でエンドツーエンドに訓練する。
  • 過学習を防ぎつつ性能を最大化するようハイパーパラメータを調整する(例:256 BiLSTM cell、8 Attention size、64 FC size)。

実験結果

リサーチクエスチョン

  • RQ1Attention-based BiLSTM は標準の RNN や CNN よりも短い 0.4s セグメントから有意な EEG MI特徴をより効果的に抽出できるか?
  • RQ2抽出された特徴の上に Graph Convolutional Network を組み込むことで、特徴のトポロジーを活用して MI 分類を改善できるか?
  • RQ3このハイブリッド BiLSTM-GCN アプローチを MI-EEG データに適用した場合のグループごとの性能向上と被験者固有の性能改善はどの程度か?

主な発見

  • 20 subjects を用いた 10-fold cross-validation でのグループ-wise 最大 GAA は 94.64%。
  • 個々の被験者に対する最大 GAA は 98.81%。
  • 平均グループパフォーマンス(GAA)は 93.04%、信頼性指標は高く(Kappa 90.71%、Precision 93.02%、Recall 93.01%、F1 92.99%)。
  • 被験者レベルの適応は、10被験者に対して平均 GAA 95.48%(± 指標)。
  • 本手法は被験者間のばらつきに対して頑健であり、0.4sサンプルの時間解像度予測を提供し、いくつかの最先端アプローチを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。