Skip to main content
QUICK REVIEW

[論文レビュー] Segment Anything Model (SAM) Meets Glass: Mirror and Transparent Objects Cannot Be Easily Detected

Dongsheng Han, Chaoning Zhang|arXiv (Cornell University)|Apr 29, 2023
Advanced Neural Network Applications被引用数 12
ひとこと要約

この論文は SAM をガラス関連タスクで評価し、SAM は透明物体や鏡面物体の検出にしばしば失敗することを明らかにし、実世界展開の安全性に懸念を投げかける。

ABSTRACT

Meta AI Research has recently released SAM (Segment Anything Model) which is trained on a large segmentation dataset of over 1 billion masks. As a foundation model in the field of computer vision, SAM (Segment Anything Model) has gained attention for its impressive performance in generic object segmentation. Despite its strong capability in a wide range of zero-shot transfer tasks, it remains unknown whether SAM can detect things in challenging setups like transparent objects. In this work, we perform an empirical evaluation of two glass-related challenging scenarios: mirror and transparent objects. We found that SAM often fails to detect the glass in both scenarios, which raises concern for deploying the SAM in safety-critical situations that have various forms of glass.

研究の動機と目的

  • SAM の透明および鏡面物体を制御されたベンチマークでセグメントする能力を評価する。
  • SAM の性能を専用のガラス・鏡セグメンテーション手法と比較して定量化する。
  • ガラス表面の反射・屈折・境界のあいまいさによる SAM の失敗モードを特定する。

提案手法

  • SA-1B の事前学習で最良の事前学習済み SAM モデル(VIT-H)を使用する。
  • 画像ごとに IoU が最も高いオブジェクトとの ground truth との IoU を用いて SAM の出力を評価する。
  • 複数データセットで SAM を最先端のガラス・鏡セグメンテーション手法と比較する。
  • 評価指標として IoU、ピクセル精度、Fβ、MAE、BER を用いる。
  • セグメンテーションギャップを強調するために偽二値表現で結果を可視化する。
Figure 1: Sample qualitative comparison results on GDD and GSD.
Figure 1: Sample qualitative comparison results on GDD and GSD.

実験結果

リサーチクエスチョン

  • RQ1SAM は標準のガラスデータセットで透明な(ガラス)物体を検出・セグメントできるか?
  • RQ2SAM は標準の鏡データセットで鏡物体を検出できるか?
  • RQ3これらのベンチマークで SAM の性能は、専用のガラス/鏡セグメンテーションモデルとどう比較されるか?
  • RQ4ガラス・鏡物体に対する SAM の一般的な失敗モードは何か?

主な発見

  • SAM はガラスデータセットで低い IoU を達成する(GDD: 48.47 IoU; GSD: 50.60 IoU) が、専門手法と比較して劣る。
  • SAM はガラス境界の検出に苦戦し、しばしばガラス自体ではなくガラスの背後の物体をセグメントする。
  • 鏡データセットでは SAM の性能は混在; MSD の IoU は 51.57、PMD の IoU は 64.75 に達し、データセット依存の挙動を示す。
  • SAM は鏡面の表面自体よりも内部の反射や鏡の中の物体をセグメントする傾向があり、反射的シーンでの失敗モードを浮き彫りにしている。
  • 専用のガラス・鏡モデル(例: EBLNet、GlassNet、MirrorNet)と比較して、SAM はほとんどのガラスデータセットで劣っているが、PMD の鏡像では比較的競争力のある結果を示す。
Figure 2: Sample qualitative comparison results on MSD and PMD.
Figure 2: Sample qualitative comparison results on MSD and PMD.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。