QUICK REVIEW

[論文レビュー] StrokeNeXt: A Siamese-encoder Approach for Brain Stroke Classification in Computed Tomography Imagery

Leo Thomas Ramos, Ángel D. Sappa|arXiv (Cornell University)|Feb 16, 2026

Acute Ischemic Stroke Management被引用数 0

ひとこと要約

StrokeNeXt は、同一 ConvNeXt エンコーダを用いた二重ブランチの Siamese エンコーダと軽量な融合デコーダを組み合わせ、2D CT 画像における脳梗塞とその亜型を分類します。推定効率の良い推論で最先端の精度を達成します。

ABSTRACT

We present StrokeNeXt, a model for stroke classification in 2D Computed Tomography (CT) images. StrokeNeXt employs a dual-branch design with two ConvNeXt encoders, whose features are fused through a lightweight convolutional decoder based on stacked 1D operations, including a bottleneck projection and transformation layers, and a compact classification head. The model is evaluated on a curated dataset of 6,774 CT images, addressing both stroke detection and subtype classification between ischemic and hemorrhage cases. StrokeNeXt consistently outperforms convolutional and Transformer-based baselines, reaching accuracies and F1-scores of up to 0.988. Paired statistical tests confirm that the performance gains are statistically significant, while class-wise sensitivity and specificity demonstrate robust behavior across diagnostic categories. Calibration analysis shows reduced prediction error compared to competing methods, and confusion matrix results indicate low misclassification rates. In addition, the model exhibits low inference time and fast convergence.

研究の動機と目的

緊急時のCTベース脳卒中分類の正確性と効率性のニーズに対応する。
脳卒中検出と亜型分類の特徴多様性を高める二系統 Siamese-エンコーダアーキテクチャを提案する。
StrokeNeXt を実世界の CT データセットで評価し、CNN および Transformer ベースラインと比較する。
校正、信頼性、計算効率を分析し臨床展開可能性を評価する。
精度とリソース使用のバランスを取る調整可能なモデルファミリを提供する。

提案手法

同一 ConvNeXt エンコーダを用いた二分岐の特徴抽出（同一CT入力を処理）
エンコーダ出力を合成シーケンスとして積み重ね、1D畳み込み融合経路とボトルネック投影で結合する融合デコーダ
融合表現上で動作する軽量な分類ヘッド
Mixed-precision と AdamW を用い、ラベルスムージング付き CrossEntropy で 224x224 CT スライスを学習
精度、F1、AUROC、AUPRC、MCC、Brier スコア、ECE、及びレイテンシ、スループット、メモリ、FLOPs などの効率指標を用いて評価

実験結果

リサーチクエスチョン

RQ1二重ブランチ ConvNeXt ベースの Siamese エンコーダは、単一ブランチモデルと比較して脳卒中検出と亜型分類を改善するか。
RQ2CT ベースの脳卒中分類におけるモデルサイズ、精度、校正、推論効率のトレードオフはどうなるか。
RQ3提案された融合デコーダは、ブランチ特徴の単純な結合や和集合より利点があるか。
RQ4StrokeNeXt は脳卒中有病性と亜型タスクで、CNN および Transformer ベースラインと比べてどの程度の性能を発揮するか。

主な発見

Method	Accuracy	Precision	Recall	F1-score	AUROC	AUPRC	Balanced Acc.	MCC	Brier score	ECE	Latency (s)	Throughput (img/s)	Peak GPU (GB)	FLOPs (G)	Params (M)	Train. time (h)
StrokeNeXt-tiny	0.978	0.978	0.978	0.978	0.986	0.987	0.971	0.950	0.021	0.053	0.002	570	1.417	8.977	57.6	0.087
StrokeNeXt-small	0.980	0.981	0.981	0.980	0.976	0.981	0.972	0.957	0.019	0.047	0.003	349	1.747	17.474	100.8	0.126
StrokeNeXt-base	0.982	0.983	0.982	0.982	0.990	0.990	0.977	0.960	0.017	0.051	0.004	222	2.641	30.853	178.5	0.161
StrokeNeXt-large	0.987	0.987	0.987	0.987	0.995	0.995	0.983	0.970	0.013	0.059	0.009	113	4.950	68.940	399.9	0.245

StrokeNeXt 系は、脳卒中有病性の精度と F1 がいずれも 0.98 超、AUROC/AUPRC は約 0.99 以上。
StrokeNeXt-tiny および StrokeNeXt-large は亜型分類性能が強く、AUROC/AUPRC ≈ 1.0、MCC ≈ 0.973–0.986。
ベースラインと比較して StrokeNeXt-tiny は精度と校正が高く、パラメータ数と FLOPs が大幅に少なく、StrokeNeXt-large はより高い精度を高コストで実現。
McNemar テストは、全てのベースラインに対して統計的に有意な改善を示す（p < 0.05）。
二重ブランチ設計はクラス別感度/特異度が堅牢で、脳卒中有病性の分離はほぼ完璧、亜型に対しては高い信頼性を示す。
StrokeNeXt はリアルタイム展開（tiny）とピーク性能（large）の間で、校正を損なうことなく tunable なトレードオフを提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。