[論文レビュー] Iris-SAM: Iris Segmentation Using a Foundation Model
本論文は Focal Loss を用いて iris セグメンテーションの Segment Anything Model (SAM) をファインチューニングし、複数の iris データセットで IoU の最先端を達成し、データセット横断 generalization を強力に示した。
Iris segmentation is a critical component of an iris biometric system and it involves extracting the annular iris region from an ocular image. In this work, we develop a pixel-level iris segmentation model from a foundational model, viz., Segment Anything Model (SAM), that has been successfully used for segmenting arbitrary objects. The primary contribution of this work lies in the integration of different loss functions during the fine-tuning of SAM on ocular images. In particular, the importance of Focal Loss is borne out in the fine-tuning process since it strategically addresses the class imbalance problem (i.e., iris versus non-iris pixels). Experiments on ND-IRIS-0405, CASIA-Iris-Interval-v3, and IIT-Delhi-Iris datasets convey the efficacy of the trained model for the task of iris segmentation. For instance, on the ND-IRIS-0405 dataset, an average segmentation accuracy of 99.58% was achieved, compared to the best baseline performance of 89.75%.
研究の動機と目的
- 信頼性の高い虹膜認識のための重要なステップとして虹膜セグメンテーションを動機づける。
- ドメイン特化のファインチューニングを通じて SAM を用いて精密な虹膜セグメンテーションを実現する。
- Focal Loss を用いて虹膜ピクセルと非虹膜ピクセルのクラス不均衡に対処する。
- まつげなど虹膜特有の課題に対する頑健性とデータセット間の一般化を評価する。
提案手法
- ボックスプロンプトを用いて虹膜画像上で Segment Anything Model (SAM) をファインチューニングする。
- 訓練中に Focal Loss を用いて虹膜/非虹膜ピクセルのクラス不均衡に対処する。
- 真値マスクから境界ボックスを導出し、一般化を向上させるためにランダムな摂動を適用する。
- SAM を単一の虹膜マスクに専念させるため multimask_output を False に設定する。
- 学習率 0.0001 の SGD で 100 エポック訓練し、IoU などの標準指標を用いる。
- ベースラインの虹膜セグメンテーション手法と比較し、データセット間の precision-recall を分析する。

実験結果
リサーチクエスチョン
- RQ1基礎的なセグメンテーションモデル(SAM)をドメイン特化のファインチューニングで虹膜セグメンテーションに効果的に適応できるか?
- RQ2Focal Loss の組み込みはクラス不均衡下で虹膜セグメンテーションの性能を向上させるか?
- RQ3ND-Iris-0405、CASIA-Iris-Interval-v3、および IIT-Delhi-Iris にまたがる Iris-SAM のデータセット間一般化能力はどの程度か?
主な発見
| データセット | 精度(平均 IoU %) ± 標準偏差 |
|---|---|
| CASIA-Iris-Interval-v3 | 96.94 ± 0.005 |
| ND-Iris-0405 | 99.58 ± 0.003 |
| IIT-Delhi-Iris | 94.34 ± 0.008 |
- Iris-SAM は CASIA-Iris-Interval-v3 で平均 IoU = 96.94% を達成した。
- Iris-SAM は ND-Iris-0405 で平均 IoU = 99.58% を達成した。
- Iris-SAM は IIT-Delhi-Iris で平均 IoU = 94.34% を達成した。
- Focal Loss は iris segmentation において Dice および Triplet loss を上回る。
- gamma 値が 2 のときデータセット全体でロバストな性能を示す。
- データセット間一般化スコアには 93.75%(ND-Iris-0405 訓練 → IIT-Delhi-Iris テスト)および 95.26%(ND-Iris-0405 訓練 → CASIA-Iris-Interval-v3 テスト)が含まれる。
- いくつかのケースでは予測が ground-truth マスクを超えることがあり、境界の識別改善を示している。
![Figure 2 : Proposed network (Iris-SAM) using Segment Anything Model (SAM) [ 17 ] . (a) Training and (b) Inference/Testing.](https://ar5iv.labs.arxiv.org/html/2402.06497/assets/x1.png)
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。