Skip to main content
QUICK REVIEW

[論文レビュー] iCassava 2019 Fine-Grained Visual Categorization Challenge

Ernest Mwebaze, Timnit Gebru|arXiv (Cornell University)|Aug 8, 2019
Smart Agriculture and AI参考文献 11被引用数 54
ひとこと要約

この論文は、Kaggleチャレンジ用のラベル付きおよび unlabeled 画像を含むカサバ葉データセットを紹介し、モバイル対応モデルでの半教師ありの粒度細分類病害分類を促進します。データセットの統計、チャレンジの設定、ResNetアーキテクチャを用いたベースライン結果を報告します。

ABSTRACT

Viral diseases are major sources of poor yields for cassava, the 2nd largest provider of carbohydrates in Africa.At least 80% of small-holder farmer households in Sub-Saharan Africa grow cassava. Since many of these farmers have smart phones, they can easily obtain photos of dis-eased and healthy cassava leaves in their farms, allowing the opportunity to use computer vision techniques to monitor the disease type and severity and increase yields. How-ever, annotating these images is extremely difficult as ex-perts who are able to distinguish between highly similar dis-eases need to be employed. We provide a dataset of labeled and unlabeled cassava leaves and formulate a Kaggle challenge to encourage participants to improve the performance of their algorithms using semi-supervised approaches. This paper describes our dataset and challenge which is part of the Fine-Grained Visual Categorization workshop at CVPR2019.

研究の動機と目的

  • アフリカの小規模農家を支援するためのカサバ病害診断の自動化を促進する。
  • 現場の課題を反映した、ラベル付き・ラベルなしデータを含む現実的な現場撮影画像データセットを提供する。
  • モバイル実装に適した半教師ありおよび軽量モデルを奨励する。
  • 公開・プライベートリーダーボードを備えたKaggleチャレンジによる公正な評価を促進する。

提案手法

  • ウガンダの約200人の農家からカサバ葉画像のデータセットを収集し、注釈を付ける。
  • 各画像に5クラス(Healthy, CMD, CBSD, CBB, CGM)のうち1つの主要病類をラベル付けする。
  • 半教師あり学習手法を促進するために大規模なラベルなし画像セットを含める。
  • 現場の実条件を反映するため、トリミングや一貫性チェックを含むデータ処理手順を公開する。
  • データ拡張を用いたResNetベースのアーキテクチャをベースライン手法として採用する。
  • 公開およびプライベートKaggleリーダーボードで総合精度を評価指標として用いる。

実験結果

リサーチクエスチョン

  • RQ1豊富なラベルなしデータを用いた半教師あり学習は、カサバ病害の粒度細分類を改善できるか?
  • RQ2背景の多様性、植物ごとの複数病害、ピントの不完全さなど、現場の撮影課題をモデルはどれだけうまく処理できるか?
  • RQ3実環境でのスマートフォンに適した軽量モデルで達成可能な精度はどの程度か?

主な発見

  • データセットは9,436枚のラベル付きおよび12,595枚のラベルなしカサバ葉画像で構成される。
  • 5クラス: Healthy, CMD, CBSD, CBB, CGM、指定された訓練/テスト分割とともに。
  • 上位解はプライベートリーダーボードで約93%の精度を達成した。
  • Winning approach leveraged unlabeled data to gain about 1% improvement.
  • All three top solutions used the ResNet architecture with data augmentation.
  • Challenge demonstrates feasibility of semi-supervised, fine-grained classification in agricultural settings.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。