[論文レビュー] PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation
PlantSegは、34植物に across 115疾患のピクセルレベルの病害セグメンテーションマスクを含む実世界条件での大規模データセットを導入し、植物病害セグメンテーションのベンチマークを可能にします。複数のベースラインを評価し、このデータセットでSegNeXtの高い性能を示します。
Plant diseases pose significant threats to agriculture. It necessitates proper diagnosis and effective treatment to safeguard crop yields. To automate the diagnosis process, image segmentation is usually adopted for precisely identifying diseased regions, thereby advancing precision agriculture. Developing robust image segmentation models for plant diseases demands high-quality annotations across numerous images. However, existing plant disease datasets typically lack segmentation labels and are often confined to controlled laboratory settings, which do not adequately reflect the complexity of natural environments. Motivated by this fact, we established PlantSeg, a large-scale segmentation dataset for plant diseases. PlantSeg distinguishes itself from existing datasets in three key aspects. (1) Annotation type: Unlike the majority of existing datasets that only contain class labels or bounding boxes, each image in PlantSeg includes detailed and high-quality segmentation masks, associated with plant types and disease names. (2) Image source: Unlike typical datasets that contain images from laboratory settings, PlantSeg primarily comprises in-the-wild plant disease images. This choice enhances the practical applicability, as the trained models can be applied for integrated disease management. (3) Scale: PlantSeg is extensive, featuring 11,400 images with disease segmentation masks and an additional 8,000 healthy plant images categorized by plant type. Extensive technical experiments validate the high quality of PlantSeg's annotations. This dataset not only allows researchers to evaluate their image classification methods but also provides a critical foundation for developing and benchmarking advanced plant disease segmentation algorithms.
研究の動機と目的
- 堅牢なモデルのための高品質で野外の植物病害セグメンテーションデータの必要性を強調する。
- 11,458枚の画像と34植物にわたる115の病害カテゴリーを含むPlantSegデータセットを、詳細なセグメンテーションマスクとともに記述する。
- 代表的なセグメンテーションモデルを用いてPlantSegのベースライン性能を確立し、アノテーション品質とデータセット特性を分析する。
提案手法
- 34植物と115疾病にわたるキーワード駆動の収集を用いたウェブ由来画像からのデータセット構築。
- クロスアノテータ検証と専門病理学者によるレビューを含む厳密なデータクリーニング。
- LabelMeを用いたポリゴンマスクによる詳細なセグメンテーションアノテーション(重複病変や変形の処理を含む)。
- 植物、病害、解像度、マスク比率、トレイン/テスト分割情報を含むメタデータの整備。
- 4つのセマンティックセグメンテーションモデル(SAN、DeepLabv3、DeepLabv3+、SegNeXt)とさまざまなバックボーンを用いたベンチマーク。
- MIoUおよび平均精度(mAcc)を用いた評価。
実験結果
リサーチクエスチョン
- RQ1大規模で野外の植物病害セグメンテーションデータセットが、フィールド条件へのセグメンテーションモデルの一般化を改善できるか?
- RQ2最先端のセマンティックセグメンテーション手法が、複雑で実世界の植物病害マスクを、実験室データセットと比較してどのように性能を発揮するか?
- RQ3セグメンテーションマスク比率と画像解像度が、植物病理学におけるモデル設計と評価にどのような洞察を提供するか?
- RQ4バックボーンのサイズやモデルアーキテクチャは、野外の植物病害セグメンテーションの性能に著しく影響するか?
- RQ5本データセットは植物病害セグメンテーション手法の開発に包括的なベンチマークとして機能するか?
主な発見
| 手法 | バックボーン | MIoU | mAcc |
|---|---|---|---|
| DeepLabv3 | ResNet-50 | 17.24 | 37.95 |
| DeepLabv3 | ResNet-101 | 20.72 | 40.63 |
| DeepLabv3+ | ResNet-50 | 25.08 | 40.66 |
| DeepLabv3+ | ResNet-101 | 27.18 | 42.29 |
| SAN | ViT-B/16 | 34.79 | 50.19 |
| SAN | ViT-L/14 | 36.91 | 52.81 |
| SegNeXt | MSCAN-L | 44.52 | 59.95 |
- PlantSegには11,458枚の画像(34植物にまたがる115の病害カテゴリー)と、植物タイプ分類用の健全な植物画像8,000枚が含まれる。
- アノテーション品質は専門病理学者によるレビューとクロスアノテータの一貫性チェックで検証された。
- MSCAN-Lバックボーンを搭載したSegNeXtが最高のMIoU(44.52%)とmAcc(59.95%)を達成。
- ViT-L/14バックボーンを搭載したSANはViT-B/16を上回り、MIoU 36.91%、mAcc 52.81%を達成。
- DeepLabv3およびDeepLabv3+は、より深いバックボーン(ResNet-101)で改善するが、PlantSegではSegNeXtに及ばない。
- 実世界の病害マスクに対して、大きなバックボーンとマルチスケール畳み込み手法の使用により、ベースラインが顕著に改善されることを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。