QUICK REVIEW

[论文解读] A Public Image Database for Benchmark of Plant Seedling Classification Algorithms

Thomas Mosgaard Giselsson, Rasmus Nyholm Jørgensen|arXiv (Cornell University)|Nov 15, 2017

Smart Agriculture and AI参考文献 9被引用 117

一句话总结

本文提出一个公开可用的图像数据库，包含 ~960 种植物幼苗，跨 12 个物种（室内，高分辨率 RGB 图像），并提出一个基于分层交叉验证、f1 分数和自举置信区间的分类性能基准。

ABSTRACT

A database of images of approximately 960 unique plants belonging to 12 species at several growth stages is made publicly available. It comprises annotated RGB images with a physical resolution of roughly 10 pixels per mm. To standardise the evaluation of classification results obtained with the database, a benchmark based on $f_{1}$ scores is proposed. The dataset is available at https://vision.eng.au.dk/plant-seedlings-dataset

研究动机与目标

提供一个 freely accessible 数据库的植物幼苗图像用于物种识别研究。
通过在受控条件下为每个物种培育多个箱子来捕捉类内变异。
标准化评估，提出一个适用于分类任务的基于 f1-score 的基准。

提出的方法

从 indoors 在 styrofoam 盒中培育的 12 个丹麦农业物种，组装一个公开的幼苗图像数据集。
使用 Canon 600D、固定焦距 50 mm、从 ~1.1–1.15 m 高度，在受控照明下以大约 10 像素/毫米的分辨率记录 RGB 图像。
提出一个基准：使用分层交叉验证和 1000 次自举重采样来报告加权平均 f1 分数和 95% 置信区间。
提供一个示例处理流程，包括该数据集上的 Naive Bayes 分割演示。

实验结果

研究问题

RQ1在受控室内条件下，选定植物物种在早期生长阶段的变异性有多大？
RQ2是否可以使用基于标准化的 f1-score 基准使该数据集上的植物幼苗分类算法的比较更加公平？
RQ3高分辨率 RGB 图像如何在早期生长阶段支持自动物种识别？
RQ4在该数据集上可以建立的分割/分类基线性能如何？

主要发现

该数据库包含 12 个物种的图像（其中 2 个未发芽，仅剩 12 个活跃物种）以及跨多个生长阶段的 960 个独立植物。
共记录并公开 407 张图像，便于基准测试和复现实验。
数据集提供大约 10 像素/mm 的分辨率，适用于高细节分析和分类器基准评估。
提出的评估方法使用 10 折交叉验证、带权重的 f1 分数和自举置信区间（1000 次自举样本）。
演示了一个使用 Naive Bayes 的分割方法，展示了可行性并突出植被分割中的边界不确定性问题。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。