QUICK REVIEW
[论文解读] A Public Image Database for Benchmark of Plant Seedling Classification Algorithms
Thomas Mosgaard Giselsson, Rasmus Nyholm Jørgensen|arXiv (Cornell University)|Nov 15, 2017
Smart Agriculture and AI参考文献 9被引用 117
一句话总结
本文提出一个公开可用的图像数据库,包含 ~960 种植物幼苗,跨 12 个物种(室内,高分辨率 RGB 图像),并提出一个基于分层交叉验证、f1 分数和自举置信区间的分类性能基准。
ABSTRACT
A database of images of approximately 960 unique plants belonging to 12 species at several growth stages is made publicly available. It comprises annotated RGB images with a physical resolution of roughly 10 pixels per mm. To standardise the evaluation of classification results obtained with the database, a benchmark based on $f_{1}$ scores is proposed. The dataset is available at https://vision.eng.au.dk/plant-seedlings-dataset
研究动机与目标
- 提供一个 freely accessible 数据库的植物幼苗图像用于物种识别研究。
- 通过在受控条件下为每个物种培育多个箱子来捕捉类内变异。
- 标准化评估,提出一个适用于分类任务的基于 f1-score 的基准。
提出的方法
- 从 indoors 在 styrofoam 盒中培育的 12 个丹麦农业物种,组装一个公开的幼苗图像数据集。
- 使用 Canon 600D、固定焦距 50 mm、从 ~1.1–1.15 m 高度,在受控照明下以大约 10 像素/毫米的分辨率记录 RGB 图像。
- 提出一个基准:使用分层交叉验证和 1000 次自举重采样来报告加权平均 f1 分数和 95% 置信区间。
- 提供一个示例处理流程,包括该数据集上的 Naive Bayes 分割演示。
实验结果
研究问题
- RQ1在受控室内条件下,选定植物物种在早期生长阶段的变异性有多大?
- RQ2是否可以使用基于标准化的 f1-score 基准使该数据集上的植物幼苗分类算法的比较更加公平?
- RQ3高分辨率 RGB 图像如何在早期生长阶段支持自动物种识别?
- RQ4在该数据集上可以建立的分割/分类基线性能如何?
主要发现
- 该数据库包含 12 个物种的图像(其中 2 个未发芽,仅剩 12 个活跃物种)以及跨多个生长阶段的 960 个独立植物。
- 共记录并公开 407 张图像,便于基准测试和复现实验。
- 数据集提供大约 10 像素/mm 的分辨率,适用于高细节分析和分类器基准评估。
- 提出的评估方法使用 10 折交叉验证、带权重的 f1 分数和自举置信区间(1000 次自举样本)。
- 演示了一个使用 Naive Bayes 的分割方法,展示了可行性并突出植被分割中的边界不确定性问题。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。