Skip to main content
QUICK REVIEW

[論文レビュー] OilSAM2: Memory-Augmented SAM2 for Scalable SAR Oil Spill Detection

Shuaiyu Chen, Ming Yin|arXiv (Cornell University)|Mar 10, 2026
Oil Spill Detection and Mitigation被引用数 0
ひとこと要約

OilSAM2は階層的で多スケールなメモリバンクと構造–意味一致のメモリ更新を備えたメモリ拡張型SAM2フレームワークを提案し、無秩序なSAR画像コレクションにおけるプロンプト駆動の油流出セグメンテーションを可能にする。

ABSTRACT

Segmenting oil spills from Synthetic Aperture Radar (SAR) imagery remains challenging due to severe appearance variability, scale heterogeneity, and the absence of temporal continuity in real world monitoring scenarios. While foundation models such as Segment Anything (SAM) enable prompt driven segmentation, existing SAM based approaches operate on single images and cannot effectively reuse information across scenes. Memory augmented variants (e.g., SAM2) further assume temporal coherence, making them prone to semantic drift when applied to unordered SAR image collections. We propose OilSAM2, a memory augmented segmentation framework tailored for unordered SAR oil spill monitoring. OilSAM2 introduces a hierarchical feature aware multi scale memory bank that explicitly models texture, structure, and semantic level representations, enabling robust cross image information reuse. To mitigate memory drift, we further propose a structure semantic consistent memory update strategy that selectively refreshes memory based on semantic discrepancy and structural variation.Experiments on two public SAR oil spill datasets demonstrate that OilSAM2 achieves state of the art segmentation performance, delivering stable and accurate results under noisy SAR monitoring scenarios. The source code is available at https://github.com/Chenshuaiyu1120/OILSAM2.

研究の動機と目的

  • Variable appearances and scales を伴う無秩序なSAR画像の油流出セグメンテーション課題に対処する。
  • 複数画像間で情報を再利用しつつ意味的ドリフトを緩和するためにメモリ拡張型SAM2フレームワークを活用する。
  • robustな跨画像情報統合のために階層的なtexture/structure/semanticメモリバンクを導入する。
  • 信頼性の手掛かりに基づくメモリ更新を可能にする構造–意味的一貫性メモリ更新戦略を開発する。

提案手法

  • SAM2ベースのプロンプト駆動セグメンテーションフレームワークと統合した階層的な多レベルメモリバンク(texture, structure, semantic)を構築する。
  • レベル特有のメモリを取得・重み付けして共通表現へ融合することで、スケール適応のメモリ融合を実施する。
  • semantic distance(コサイン距離)とgradientベースの構造変化を用いた、意味–構造の不一致に基づいてメモリ更新をトリガーする構造–意味的一貫性メモリ更新機構を導入する。
  • 元のSAM2モジュールを凍結したまま、スケールアダプタ・メモリコンポーネント・マスクデコーダを訓練する。
  • 二クラスの油流出タスクに対してウェイト付き二値交差エントロピー損失でセグメンテーションを最適化する。
Fig. 1 : Overview of the proposed OilSAM2 framework. Given an input SAR image and user prompt, hierarchical features are extracted and organized into texture-, structure-, and semantic-level representations. Each level interacts with a corresponding memory group via scale-wise attention. The retriev
Fig. 1 : Overview of the proposed OilSAM2 framework. Given an input SAR image and user prompt, hierarchical features are extracted and organized into texture-, structure-, and semantic-level representations. Each level interacts with a corresponding memory group via scale-wise attention. The retriev

実験結果

リサーチクエスチョン

  • RQ1 無秩序なSAR画像間でのメモリ拡張セグメンテーションは、単一画像ベースのSAM法と比較して油流出の境界定義を改善するか。
  • RQ2 テクスチャ・構造・意味の手掛かりを捉える多段階メモリバンクは、海況・スペックルノイズ・類似現象に対する頑健性を高めるか。
  • RQ3 構造–意味的一貫性メモリ更新は、無秩序なSAR画像コレクションを処理する際の意味的ドリフトを低減するか。

主な発見

ModelSeaSurface(%, ↑)Oil Spill(%, ↑)Look-alike(%, ↑)Ship(%, ↑)Land(%, ↑)mIoU(%, ↑)
Unet93.9053.7939.5544.9392.6864.97
LinkNet94.9951.5343.2440.2393.9764.79
PSPNet92.7840.1033.7924.4286.9055.60
Deeplabv294.0925.5740.3011.4174.9949.27
Deeplabv2(msc)95.3949.2831.2688.6593.9762.83
Deeplabv3+96.4353.3855.4027.6392.4465.06
TransOilSeg97.0261.3862.4133.4994.3969.74
YOLOv8-SAM94.3441.8448.1552.4887.6564.89
SAM-OIL96.0551.6055.6052.5591.8169.52
OSDMamba96.4765.5947.5746.8594.7670.25
OilSAM2 (Ours)95.1065.9254.1656.1892.0772.62
Table 2 – SOS Dataset (PALSAR/Sentinel-1)
Table 3 – Ablation (SOS Dataset)
  • OilSAM2は二つの公開SAR油流出データセットで最先端の性能を達成し、SAMベースおよび他のベースラインを上回る。
  • M4Dでは、OilSAM2は油流出のIoUを顕著に改善し、全体的なmIoUが高い。
  • SOSでは、OilSAM2は最も高いmIoUと堅牢なF1スコア/リコールをPALSARおよびSentinel-1モダリティで達成した。
  • マルチスケールメモリバンクと構造–意味更新は、単一構成のアブレーションよりも大きな利得を提供する。
  • このアプローチは、さまざまな海況下で境界の描写と小規模/断片の検出を改善している。
Fig. 2 : Qualitative results of the ablation study(On SOS Dataset).
Fig. 2 : Qualitative results of the ablation study(On SOS Dataset).

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。