Skip to main content
QUICK REVIEW

[論文レビュー] Plant identification in an open-world (LifeCLEF 2016)

Hervé Goëau, Pierre Bonnet|ArXiv.org|Sep 25, 2025
Smart Agriculture and AI参考文献 9被引用数 53
ひとこと要約

LifeCLEF 2016 の植物同定タスクは、未知分類を拒否する課題を強調しつつ、CNNベースのシステムを比較し、1000種の西ヨーロッパ植物を含む110,000枚を超える画像でオープンセット認識を評価しました。

ABSTRACT

The LifeCLEF plant identification challenge aims at evaluating plant identification methods and systems at a very large scale, close to the conditions of a real-world biodiversity monitoring scenario. The 2016-th edition was actually conducted on a set of more than 110K images illustrating 1000 plant species living in West Europe, built through a large-scale participatory sensing platform initiated in 2011 and which now involves tens of thousands of contributors. The main novelty over the previous years is that the identification task was evaluated as an open-set recognition problem, i.e. a problem in which the recognition system has to be robust to unknown and never seen categories. Beyond the brute-force classification across the known classes of the training set, the big challenge was thus to automatically reject the false positive classification hits that are caused by the unknown classes. This overview presents more precisely the resources and assessments of the challenge, summarizes the approaches and systems employed by the participating research groups, and provides an analysis of the main outcomes.

研究の動機と目的

  • 実世界の生物多様性モニタリングに近いオープンセット条件下で大規模に植物識別手法を評価する。
  • 既知種を識別しつつ未知・未出現の植物カテゴリへの頑健性を評価する。
  • オープンセット性能と未知クラス拒否を研究するためのベンチマークデータセットと指標を提供する。
  • 干渉物が多いテストセットの下で、異なるCNNベースおよびハイブリッド手法の性能を分析する。

提案手法

  • 学習用データを PlantCLEF 2015 由来でテスト画像の真偽を付与して拡張する。
  • 既知クラスと未知クラスを含む Pl@ntNet クエリからテストセットを構築する(オープンセット)。
  • オープンセット設定における平均適合度 (mean Average Precision) の指標 mAP-open および侵略的種 monitoring を対象としたバリアント mAP-open-invasive で提出物を評価する。
  • CNN および非 CNN のベースライン、アンサンブルおよびメタデータの活用を含め、グループごとに最大4回の試行を許可する。
  • 未知クラスの拒否戦略を評価し、異なる新規性レベルでの性能を報告する。

実験結果

リサーチクエスチョン

  • RQ1CNN ベースの植物同定システムは、多くの未知クラスが存在するオープンワールド環境でどの程度機能するか?
  • RQ2未知クラスの干渉がオープンセットの mAP にどのような影響を与えるか?
  • RQ3明示的な未知クラス拒否戦略は頑健性を向上させるか、どの新規性条件下で?
  • RQ4新規性の割合が増加するストリーミングのような状況で、性能はどの程度低下するか?
  • RQ5オープンセット植物識別の性能におけるアーキテクチャ、アンサンブル、メタデータの相対的寄与度は?

主な発見

RunKey-wordsRejectionmAP-openmAP-open-invasivemAP-closed
Bluefield Run4VGGNet, combine outputs from a same observationthresholds by class (train+validation)0.7420.7170.827
SabanciU GebzeTU Run12x(VGGNet,GoogleNet) tuned with resp. 70k, 115k training imagesGoogleNet 70k/70k Plant/ImageNet0.7380.7040.806
SabanciU…Run3SabanciUGebzeTU Run1Manually removed 90 test images0.7370.7030.807
Bluefield Run3Bluefield Run 4thresholds by class0.7360.7180.82
SabanciU…Run2SabanciUGebzeTU Run1-0.7360.6830.807
SabanciU…Run4SabanciUGebzeTU Run1-0.7350.6950.802
CMP Run1Bagging of 3xResNet-152-0.710.6530.79
LIIR KUL Run3CaffeNet, VGGNet16, 3xGoogleNet, adding 12k external plant imagesthreshold0.7030.6740.761
LIIR KUL Run2LIIR KUL Run 3threshold0.6920.6670.744
LIIR KUL Run1LIIR KUL Run 3threshold0.6690.6520.708
UM Run4VGGNet16-0.6690.5980.742
CMP Run2ResNet-152-0.6440.5640.729
CMP Run3ResNet-152 (2015training)-0.6390.590.723
QUT Run31 ”general” GoogleNet, 6 ”organ” GoogleNets, observation combination-0.6290.610.696
Floristic Run3GoogleNet, metadata-0.6270.5330.693
UM Run1VGGNet16-0.6270.5370.7
Floristic Run1GoogleNet-0.6190.5410.694
Bluefield Run1VGGNetthresholds by class0.6110.60.692
Bluefield Run2VGGNetthresholds by class0.6110.60.693
Floristic Run2GoogleNetthresholds by class0.6110.5380.681
QUT Run1GoogleNet-0.6010.5630.672
UM Run3VGGNet16 with dedicated and combined organ & species layers-0.5890.5090.652
QUT Run26 ”organ” GoogleNets, observation combination-0.5640.5620.641
UM Run2VGGNet16 from scratch (without ImageNet2012)-0.4810.4460.552
QUT Run4QUT Run3threshold0.3670.3590.378
BMETMITRun4AlexNet & BVWs & metadata-0.1740.1440.213
BMETMITRun3AlexNet & BVWs & metadatathreshold by classifier0.170.1250.197
BMETMITRun1AlexNet-0.1690.1250.196
BMETMITRun2BVWs (fisher vectors)-0.0660.1280.101
  • CNN ベースのシステムが上位結果を支配しており、上位26件は CNN を使用。
  • 侵入種モニタリングにおける mAP-open のベスト設定は 0.718 で、観測レベルのプーリングからの利得が主な要因。
  • オープンセットの干渉は全システムの性能を低下させるが、CNN は未知クラスに対して比較的頑健。
  • 新規性が高い場合、平均適合度は大幅に低下する(例:クエリの 25% のみが既知の場合は 0.45 未満)。
  • 拒否戦略は moderate novelity 下で CNN ベースの基準に比べて限定的な追加利益を提供し、適応型オープンセット拒否手法の余地を示唆する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。