Skip to main content
QUICK REVIEW

[論文レビュー] MTS-CSNet: Multiscale Tensor Factorization for Deep Compressive Sensing on RGB Images

Mehmet Yamac, Lei Xu|arXiv (Cornell University)|Feb 4, 2026
Sparse and Compressive Sensing Techniques被引用数 0
ひとこと要約

MTS-CSNet は Multiscale Tensor Summation を学習可能な非反復圧縮感知演算子としてテンソル空間で用い、軽量な MTSNet の改良を経て高効率で最先端の RGB 画像再構成を実現します。

ABSTRACT

Deep learning based compressive sensing (CS) methods typically learn sampling operators using convolutional or block wise fully connected layers, which limit receptive fields and scale poorly for high dimensional data. We propose MTSCSNet, a CS framework based on Multiscale Tensor Summation (MTS) factorization, a structured operator for efficient multidimensional signal processing. MTS performs mode-wise linear transformations with multiscale summation, enabling large receptive fields and effective modeling of cross-dimensional correlations. In MTSCSNet, MTS is first used as a learnable CS operator that performs linear dimensionality reduction in tensor space, with its adjoint defining the initial back-projection, and is then applied in the reconstruction stage to directly refine this estimate. This results in a simple feed-forward architecture without iterative or proximal optimization, while remaining parameter and computation efficient. Experiments on standard CS benchmarks show that MTSCSNet achieves state-of-the-art reconstruction performance on RGB images, with notable PSNR gains and faster inference, even compared to recent diffusion-based CS methods, while using a significantly more compact feed-forward architecture.

研究の動機と目的

  • 高次元 RGB データに対する圧縮感知制約下で効率的な再構成を動機づける。
  • 学習可能な CS 演算子として構造化されたマルチスケールテンソル演算子(MTS)を導入する。
  • MTS センシング、 adjoint バックプロジェクション、MTSNet 改善を組み合わせた非反復のエンドツーエンドアーキテクチャを提供する。
  • 拡散ベースの CS 手法と比較して再構成品質と計算コストの改善を示す。)

提案手法

  • 複数スケールでモード方向の射影を直接テンソル空間内で実行する学習可能 CS 演算子として Multiscale Tensor Summation (MTS) を採用する。
  • MTS をパッチ埋め込みおよび逆埋め込み演算子を用いたパッチ-wise の多項式射影のスケール和として定義する。
  • 非線形 MHG 活性化を備えたアジャイント MTS によるバックプロジェクション前の初期代理再構成を得る。
  • 軽量な MTSNet から成る複数の MTSBlocks で代理再構成を改善する。
  • 逐次最適化を伴わないフォワードフィード型で全体パイプラインをエンドツーエンドで学習する。

実験結果

リサーチクエスチョン

  • RQ1マルチスケールのテンソルベース CS 演算子はブロックベース設計よりグローバルな空間・チャネル相関をより効果的に捉えられるか。
  • RQ2非線形なアジャイントバックプロジェクションは線形のアジャイントと比べて初期再構成を改善するか。
  • RQ3MTS 深さ(T)とブロック数(NB)を変えると再構成品質と効率にどのような影響があるか。
  • RQ4MTS-CSNet は PSNR/SSIM および実行時間の点で最先端の拡散ベース CS 手法と比較してどうか。

主な発見

  • MTS-CSNet は Urban100 および DIV2K の複数のサンプリングレートで RGB 画像の最先端再構成を達成している。
  • 48 ステップ、3 ブロックの変種は競合手法に対して顕著な PSNR/SSIM 増分を示し、30% および 50% サンプリング時に最良または第2位の性能を示す。
  • 低 CS 比率で拡散ベースおよび他の CS 手法と比較してパラメータ数・メモリ使用量・GFLOPs・推論時間が大幅に低い。
  • アジャイントバックプロジェクションにおける非線形 MHG 活性化は代理再構成品質を大幅に改善する。
  • MTS ブロック数を増やすとデータセット全体で再構成性能が一貫して向上する。
  • 本手法は非反復的で高速な再構成を実現しつつ、精度は競合またはそれを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。