[论文解读] An open access repository of images on plant health to enable the development of mobile disease diagnostics through machine learning and crowdsourcing
本文介绍了一个包含五万五千多张由专家精心筛选的健康与病害作物叶片图像的开源存储库,托管于PlantVillage.org,旨在支持利用机器学习和众包技术开发基于移动设备的植物病害诊断工具。该数据集可用于训练计算机视觉模型以检测作物病害,从而减少农业中的产量损失,特别是在发展中国家。
Human society needs to increase food production by an estimated 70% by 2050 to feed an expected population size that is predicted to be over 9 billion people. Currently infectious diseases reduce the potential yield by an average of 40% with many farmers in the developing world experiencing yield losses as high as 100%. Infectious diseases of crops are not new and historic examples such as the Irish Potato Famine of 1845-49 demonstrate this. But what is new is the widespread distribution of smartphones among crop growers around the world with an expected 5 billion smartphones by 2020. This offers the potential of turning the smartphone into a valuable tool for diverse communities growing food. One potential application is the development of mobile disease diagnostics through machine learning and crowdsourcing. Computer vision and machine learning have shown their potential to automatically classify images. To do this for plant diseases requires a training set that facilitates the development of the algorithms. Here we announce the release of >50,000 expertly curated images on healthy and infected leaves of crops plants through the existing platform www.PlantVillage.org. We describe both the data and the platform. These data are the beginning of an on-going, crowdsourcing effort to enable computer vision approaches to help solve the problem of yield losses in crop plants due to infectious diseases.
研究动机与目标
- 为解决农业中病害检测的可扩展性与准确性需求,特别是在因传染性疾病导致产量损失超过40%的发展中国家地区。
- 利用智能手机的全球普及趋势(预计2020年达到50亿部)来实现面向农民的基于移动设备的诊断工具。
- 创建一个大规模、经专家筛选、开源的作物叶片图像存储库,用于训练机器学习模型以实现自动病害分类。
- 启动一项由众包驱动的持续性工作,以扩展和维护该数据集,持续提升植物健康诊断的性能。
- 支持开发可访问、低成本的诊断工具,结合计算机视觉与机器学习技术,以减少作物损失并提升粮食安全。
提出的方法
- 作者通过专家验证,整理了超过五万张高质量的作物叶片图像,涵盖健康与病害样本。
- 图像通过现有的PlantVillage.org平台进行收集与组织,该平台支持图像提交、标注与共享。
- 该数据集支持监督式机器学习,图像按病害类型与健康状态进行标注。
- 平台通过众包方式支持持续的数据收集,允许农民、研究人员及公众参与贡献。
- 该存储库对公众开放,设计上具备可扩展性,支持与机器学习框架集成,用于病害分类。
- 系统通过确保图像质量和元数据适合训练用于智能手机应用程序的模型,支持移动端部署。
实验结果
研究问题
- RQ1大规模、开源的植物叶片图像存储库如何提升基于移动设备的植物病害诊断的准确性与可及性?
- RQ2众包在扩展和维护高质量数据集方面,对训练植物健康领域机器学习模型起到何种作用?
- RQ3通过专家筛选并公开的图像数据,是否能显著减少作物病害导致的产量损失,实现早期病害检测?
- RQ4如何利用智能手机技术,向发展中国家的农民提供可扩展、低成本的诊断工具?
- RQ5结合计算机视觉与众包数据收集,其在支持可持续粮食生产方面具有何种潜力?
主要发现
- 作者成功发布了包含五万五千多张由专家筛选的作物叶片图像的数据集,涵盖健康与病害状态,以支持机器学习开发。
- 该数据集托管于PlantVillage.org平台,支持公众访问、贡献及通过众包实现持续扩展。
- 该开源存储库的可用性促进了计算机视觉模型的训练,实现自动植物病害分类。
- 该举措为可在高产量损失地区部署的可扩展、基于移动设备的诊断工具奠定了基础。
- 该平台支持将机器学习与众包相结合,创建可持续的、社区驱动的植物健康监测资源。
- 该数据集的设计支持在低资源环境中的实际部署,契合全球粮食安全目标。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。