[논문 리뷰] An open access repository of images on plant health to enable the development of mobile disease diagnostics through machine learning and crowdsourcing
이 논문은 머신러닝과 커뮤니티 기반 기여를 활용한 모바일 기반 식물 질병 진단 개발을 지원하기 위해 PlantVillage.org에서 운영하는 50,000점 이상의 전문가가 검증한 건강한 식물 잎과 병변이 있는 잎의 오픈 액세스 레포지터리를 소개한다. 이 데이터셋은 농업 분야에서 수확 손실을 줄이기 위해 컴퓨터 비전 모델을 훈련시켜 병원균에 의한 수확 손실을 감소시키는 데 목적이 있으며, 특히 개발도상국에서 효과를 발휘한다.
Human society needs to increase food production by an estimated 70% by 2050 to feed an expected population size that is predicted to be over 9 billion people. Currently infectious diseases reduce the potential yield by an average of 40% with many farmers in the developing world experiencing yield losses as high as 100%. Infectious diseases of crops are not new and historic examples such as the Irish Potato Famine of 1845-49 demonstrate this. But what is new is the widespread distribution of smartphones among crop growers around the world with an expected 5 billion smartphones by 2020. This offers the potential of turning the smartphone into a valuable tool for diverse communities growing food. One potential application is the development of mobile disease diagnostics through machine learning and crowdsourcing. Computer vision and machine learning have shown their potential to automatically classify images. To do this for plant diseases requires a training set that facilitates the development of the algorithms. Here we announce the release of >50,000 expertly curated images on healthy and infected leaves of crops plants through the existing platform www.PlantVillage.org. We describe both the data and the platform. These data are the beginning of an on-going, crowdsourcing effort to enable computer vision approaches to help solve the problem of yield losses in crop plants due to infectious diseases.
연구 동기 및 목표
- 농업 분야에서 확장 가능하고 정확한 식물 질병 진단의 필수적 필요성을 해결하기 위해, 특히 전염성 병원균으로 인한 수확 손실이 40%를 초과하는 개발도상국에서의 적용을 목표로 한다.
- 2020년까지 50억 대에 달할 것으로 예상되는 스마트폰의 세계적 보급을 활용하여 农민들이 사용할 수 있는 모바일 기반 진단 도구를 개발한다.
- 대규모로 전문가가 검증한 오픈 액세스 식물 잎 이미지 레포지터리를 구축하여 기계학습 모델을 위한 자동 질병 분류 훈련을 가능하게 한다.
- 지속적인 향상이 가능한 식물 건강 진단을 위해 커뮤니티 기반 기여를 통한 지속적인 데이터 확장 및 유지보수 작업을 시작한다.
- 컴퓨터 비전과 머신러닝을 활용한 접근성 있고 저비용의 진단 도구 개발을 지원하여 수확 손실을 줄이고 식량 안보를 향상시킨다.
제안 방법
- 저자들은 전문가 검증을 통해 50,000점 이상의 고해상도 식물 잎 이미지(건강한 상태 및 병변이 있는 상태 포함)를 수집하고 정제하였다.
- 이미지들은 기존의 PlantVillage.org 플랫폼를 활용하여 수집 및 정리되었으며, 이미지 제출, 레이블 부여, 공유를 지원한다.
- 데이터셋은 감시 학습 기반의 머신러닝을 지원하도록 구성되었으며, 질병 유형과 건강 상태에 따라 이미지가 레이블링되었다.
- 플랫폼는 农민, 연구자 및 일반 대중이 기여할 수 있도록 커뮤니티 기반 기반의 지속적인 데이터 수집을 가능하게 한다.
- 레포지터리는 공개 접근이 가능하며 확장 가능하도록 설계되어, 질병 분류를 위한 머신러닝 프레임워크와의 통합을 지원한다.
- 스마트폰 애플리케이션에서 사용되는 모델 훈련에 적합한 이미지 품질과 메타데이터를 확보함으로써 모바일 배포를 지원한다.
실험 결과
연구 질문
- RQ1대규모 오픈 액세스 식물 잎 이미지 레포지터리는 모바일 기반 식물 질병 진단의 정확성과 접근성을 어떻게 향상시킬 수 있는가?
- RQ2커뮤니티 기반 기여는 기계학습 모델 훈련을 위한 고품질 데이터셋의 확장 및 유지보수에 어떤 역할을 할 수 있는가?
- RQ3전문가가 검증한 공개 이미지 데이터는 조기 질병 진단을 가능하게 함으로써 수확 식물의 수확 손실을 상당히 줄일 수 있는가?
- RQ4스마트폰 기술은 개발도상국의 농민들에게 확장 가능하고 저비용의 진단 도구를 어떻게 제공할 수 있는가?
- RQ5컴퓨터 비전과 커뮤니티 기반 데이터 수집을 융합할 경우 지속 가능한 식량 생산을 지원할 잠재력은 무엇인가?
주요 결과
- 저자들은 기계학습 개발을 지원하기 위해 전문가가 검증한 50,000점 이상의 식물 잎 이미지(건강한 상태 및 병변이 있는 상태 포함)를 성공적으로 공개하였다.
- 이 데이터셋은 PlantVillage.org 플랫폼에 호스팅되어 있으며, 공개 접근, 기여, 지속적인 확장이 가능하다.
- 이 오픈 액세스 레포지터리의 가용성은 자동 식물 질병 분류를 위한 컴퓨터 비전 모델 훈련을 촉진한다.
- 이 이니셔티브는 고수확 손실이 발생하는 지역에 배포 가능한 확장 가능한 모바일 기반 진단 도구의 기반을 마련한다.
- 플랫폼는 머신러닝과 커뮤니티 기반 기여를 융합하여 지속 가능한 공동체 기반의 식물 건강 모니터링 자원을 조성한다.
- 이 데이터셋은 자원이 제한된 환경에서의 실제 적용을 고려하여 설계되었으며, 세계적 식량 안보 목표와 부합한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.