Skip to main content
QUICK REVIEW

[论文解读] A Public Image Database for Benchmark of Plant Seedling Classification Algorithms

Thomas Mosgaard Giselsson, Rasmus Nyholm Jørgensen|arXiv (Cornell University)|Nov 15, 2017
Smart Agriculture and AI参考文献 9被引用 117
一句话总结

本文提出一个公开可用的图像数据库,包含 ~960 种植物幼苗,跨 12 个物种(室内,高分辨率 RGB 图像),并提出一个基于分层交叉验证、f1 分数和自举置信区间的分类性能基准。

ABSTRACT

A database of images of approximately 960 unique plants belonging to 12 species at several growth stages is made publicly available. It comprises annotated RGB images with a physical resolution of roughly 10 pixels per mm. To standardise the evaluation of classification results obtained with the database, a benchmark based on $f_{1}$ scores is proposed. The dataset is available at https://vision.eng.au.dk/plant-seedlings-dataset

研究动机与目标

  • 提供一个 freely accessible 数据库的植物幼苗图像用于物种识别研究。
  • 通过在受控条件下为每个物种培育多个箱子来捕捉类内变异。
  • 标准化评估,提出一个适用于分类任务的基于 f1-score 的基准。

提出的方法

  • 从 indoors 在 styrofoam 盒中培育的 12 个丹麦农业物种,组装一个公开的幼苗图像数据集。
  • 使用 Canon 600D、固定焦距 50 mm、从 ~1.1–1.15 m 高度,在受控照明下以大约 10 像素/毫米的分辨率记录 RGB 图像。
  • 提出一个基准:使用分层交叉验证和 1000 次自举重采样来报告加权平均 f1 分数和 95% 置信区间。
  • 提供一个示例处理流程,包括该数据集上的 Naive Bayes 分割演示。

实验结果

研究问题

  • RQ1在受控室内条件下,选定植物物种在早期生长阶段的变异性有多大?
  • RQ2是否可以使用基于标准化的 f1-score 基准使该数据集上的植物幼苗分类算法的比较更加公平?
  • RQ3高分辨率 RGB 图像如何在早期生长阶段支持自动物种识别?
  • RQ4在该数据集上可以建立的分割/分类基线性能如何?

主要发现

  • 该数据库包含 12 个物种的图像(其中 2 个未发芽,仅剩 12 个活跃物种)以及跨多个生长阶段的 960 个独立植物。
  • 共记录并公开 407 张图像,便于基准测试和复现实验。
  • 数据集提供大约 10 像素/mm 的分辨率,适用于高细节分析和分类器基准评估。
  • 提出的评估方法使用 10 折交叉验证、带权重的 f1 分数和自举置信区间(1000 次自举样本)。
  • 演示了一个使用 Naive Bayes 的分割方法,展示了可行性并突出植被分割中的边界不确定性问题。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。