[論文レビュー] DenoMamba: A fused state-space model for low-dose CT denoising
DenoMambaは、空間コンテキストとチャネルコンテキストを融合する新しい状態空間モデリング手法(FuseSSMブロック)を導入し、LDCTデノイジングにおいてCNN/transformerベースラインより同等の複雑さで優れた画質を達成します。
Low-dose computed tomography (LDCT) lower potential risks linked to radiation exposure while relying on advanced denoising algorithms to maintain diagnostic quality in reconstructed images. The reigning paradigm in LDCT denoising is based on neural network models that learn data-driven image priors to separate noise evoked by dose reduction from underlying tissue signals. Naturally, the fidelity of these priors depend on the model's ability to capture the broad range of contextual features evident in CT images. Earlier convolutional neural networks (CNN) are highly adept at efficiently capturing short-range spatial context, but their limited receptive fields reduce sensitivity to interactions over longer distances. Although transformers based on self-attention mechanisms have recently been posed to increase sensitivity to long-range context, they can suffer from suboptimal performance and efficiency due to elevated model complexity, particularly for high-resolution CT images. For high-quality restoration of LDCT images, here we introduce DenoMamba, a novel denoising method based on state-space modeling (SSM), that efficiently captures short- and long-range context in medical images. Following an hourglass architecture with encoder-decoder stages, DenoMamba employs a spatial SSM module to encode spatial context and a novel channel SSM module equipped with a secondary gated convolution network to encode latent features of channel context at each stage. Feature maps from the two modules are then consolidated with low-level input features via a convolution fusion module (CFM). Comprehensive experiments on LDCT datasets with 25\% and 10\% dose reduction demonstrate that DenoMamba outperforms state-of-the-art denoisers with average improvements of 1.4dB PSNR, 1.1% SSIM, and 1.6% RMSE in recovered image quality.
研究の動機と目的
- LDCTデノイジングの動機づけ:放射線量の削減と診断用画像品質のバランスを取る。
- 短距離・長距離の文脈を捉える新しいSSMベースのデノイジングアーキテクチャ(DenoMamba)を提案する。
- 空間SSMとチャネルSSMを融合したブロックが、同程度の複雑さを持つCNNやTransformerよりも性能を上回ることを示す。
- LDCTデータセットにおける25%および10%の線量削減に対して堅牢なデノイジングを示す。
- 再現性を促進するオープンソース実装を提供する。
提案手法
- 空間SSMモジュールとチャネルSSMモジュールを組み合わせたFuseSSMブロックを導入する。
- チャネルSSM内で潜在的なチャネル特徴を抽出するために、二次ゲート付き畳み込みネットワークを用いる。
- 畳み込み融合モジュール(CFM)を介して、文脈表現と元の入力を融合する。
- エンコーダ-デコーダ段間に長距離残差接続を備えたアワーグラス型アーキテクチャを採用する。
- LDCT-to-NDCT画像対で平均二乗誤差損失を用いて訓練し、PSNR、SSIM、RMSEで評価する。
実験結果
リサーチクエスチョン
- RQ1低線量レベルで、空間-チャネルを融合した状態空間モデルはCNN/Transformer系のベースラインよりLDCTデノイジングを改善できるか?
- RQ2提案手法DenoMambaは、長距離文脈を効率的に捉えつつ高い空間精度を維持できるか?
- RQ3構成要素(cha SSM、spa SSM、CFM、GCN、identity path)を除去した場合、デノイジング性能にどのような影響があるか?
- RQ425%および10%の線量削減と複数の再構成カーネルに対してDenoMambaはどのように性能を発揮するか?
- RQ5本手法のコードは再現性のために公開されているか?
主な発見
- DenoMambaは25%線量のLDCTデータセットにおいて、競合手法よりも高いPSNRとSSIMを達成し、RMSEを低く抑える。
- アブレーション研究は、最良の性能のためには空間SSMとチャネルSSMの両方のモジュールと、GCNベースのチャネル経路の重要性を示す。
- 提案手法は、1-mmおよび3-mmスライス厚さとさまざまなカーネルにわたり、優れた画像品質を示す。
- 本モデルは、従来のCNNと同程度のパラメータ数でありながら、長距離文脈を捉えるのに線形に近い複雑さを持つ。
- DenoMambaのコードは公開されている。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。