[論文レビュー] OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation
OPTED は SAM 3 のゼロショット分割を用いて前処理済みのトラコーマ眼データセットを提供する four-step パイプラインとプロンプト評価を詳述し、ML準備済み画像の二つの出力フォーマットを作成します。
Trachoma remains the leading infectious cause of blindness worldwide, with Sub-Saharan Africa bearing over 85% of the global burden and Ethiopia alone accounting for more than half of all cases. Yet publicly available preprocessed datasets for automated trachoma classification are scarce, and none originate from the most affected region. Raw clinical photographs of eyelids contain significant background noise that hinders direct use in machine learning pipelines. We present OPTED, an open-source preprocessed trachoma eye dataset constructed using the Segment Anything Model 3 (SAM 3) for automated region-of-interest extraction. We describe a reproducible four-step pipeline: (1) text-prompt-based zero-shot segmentation of the tarsal conjunctiva using SAM 3, (2) background removal and bounding-box cropping with alignment, (3) quality filtering based on confidence scores, and (4) Lanczos resizing to 224x224 pixels. A separate prompt-selection stage identifies the optimal text prompt, and manual quality assurance verifies outputs. Through comparison of five candidate prompts on all 2,832 known-label images, we identify "inner surface of eyelid with red tissue" as optimal, achieving a mean confidence of 0.872 (std 0.070) and 99.5% detection rate (the remaining 13 images are recovered via fallback prompts). The pipeline produces outputs in two formats: cropped and aligned images preserving the original aspect ratio, and standardized 224x224 images ready for pre-trained architectures. The OPTED dataset, preprocessing code, and all experimental artifacts are released as open source to facilitate reproducible trachoma classification research.
研究の動機と目的
- Sub-Saharan Africa由来の公開可能な前処理済みトラコーマ眼画像データセットを提供する。
- eyelid 画像の ROI 抽出のために SAM 3 を用いた再現可能な four-step 前処理パイプラインを開発する。
- tarsal conjunctiva のセグメンテーションの最適な SAM 3 プロンプトを特定するためにテキストプロンプトを体系的に評価する。
- データセット、コード、アーティファクトを公開して再現性のあるトラコーマ分類研究を可能にする。
提案手法
- ゼロショット設定で SAM 3 を用い、 eyelid 写真から tarsal conjunctiva をセグメント化する際に five candidate text prompts を適用する。
- 背景除去、マージン 5% のバウンディングボックスクロップ、および水平揃えを適用してクロップ済み画像を得る。
- 標準的なアーキテクチャと互換性のあるよう Lanczos 補間を用いて画像を 224x224 ピクセルにリサイズする。
- 検出率、平均信頼度、マスクカバレッジに基づいて最適なプロンプトを選択するプロンプト選択ステージを実施し、外れ値にはフォールバック機構を設ける。
- 出力は二つの形式で提供:クロップ済み/揃え済み画像と標準化された 224x224 画像、並びに完全なオープンソース前処理コード。

実験結果
リサーチクエスチョン
- RQ1SAM 3 のどのテキストプロンプトがトラコーマ眼瞼画像におけるtarsal conjunctiva の最良のセグメンテーション性能をもたらすか。
- RQ2完全に再現可能な four-step 前処理パイプラインは raw トラコーマ写真から信頼性のある 224x224 ML-ready 画像を作成できるか。
- RQ3プロンプト選択が検出率、信頼度、マスクカバレッジに対し多国間データセットでどのような影響を与えるか。
- RQ4Open-source OPTED パイプラインは Sub-Saharan Africa および他地域の多様なトラコーマ画像に対してどの程度一般化できるか。
主な発見
| Prompt | Det. | Miss | Score | Std | Area |
|---|---|---|---|---|---|
| red tissue inside eye | 99.8% | 6 | 0.853 | 0.069 | 28.2% |
| inner surface of eyelid | 99.9% | 1 | 0.846 | 0.080 | 24.0% |
| red lining inside eyelid | 98.7% | 36 | 0.737 | 0.076 | 26.7% |
| membrane under eyelid | 99.5% | 14 | 0.805 | 0.082 | 26.3% |
| inner surface of eyelid with red tissue | 99.5% | 13 | 0.873 | 0.069 | 29.8% |
- プロンプト「inner surface of eyelid with red tissue」が最も高い平均信頼度 (0.873) および最大マスク領域 (29.8%) を達成した。
- データセット全体の SAM 3 の平均信頼度は 0.872、標準偏差は 0.070。
- 検出率は 99.5% で、13 件のミスはフォールバックプロンプトで回収された。
- OPTED パイプラインは 2 形式:クロップ済み/揃え済み画像と 224x224 PNG 画像を生成し、分層化された訓練/検証/テスト分割 (70/15/15) を伴う。
- Lanczos リサイズは 224x224 出力の PSNR (39.16 dB) および SSIM (0.9713) が最高となる。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。