QUICK REVIEW

[論文レビュー] Implementation of Fruits Recognition Classifier using Convolutional Neural Network Algorithm for Observation of Accuracies for Various Hidden Layers

Shadman Sakib, Zahidun Ashrafi|arXiv (Cornell University)|Apr 1, 2019

Smart Agriculture and AI参考文献 17被引用数 30

ひとこと要約

本論文では、Fruits-360データセットを用いて、深層畳み込みニューラルネットワーク（CNN）分類器を提案し、さまざまな隠れ層構成と学習エポック数における精度を体系的に評価している。最適化されたネットワークアーキテクチャとハイパーパramータチューニングにより、100%のテスト精度と99.79%の学習精度を達成した。

ABSTRACT

Fruit recognition using Deep Convolutional Neural Network (CNN) is one of the most promising applications in computer vision. In recent times, deep learning based classifications are making it possible to recognize fruits from images. However, fruit recognition is still a problem for the stacked fruits on weighing scale because of the complexity and similarity. In this paper, a fruit recognition system using CNN is proposed. The proposed method uses deep learning techniques for the classification. We have used Fruits-360 dataset for the evaluation purpose. From the dataset, we have established a dataset which contains 17,823 images from 25 different categories. The images are divided into training and test dataset. Moreover, for the classification accuracies, we have used various combinations of hidden layer and epochs for different cases and made a comparison between them. The overall performance losses of the network for different cases also observed. Finally, we have achieved the best test accuracy of 100% and a training accuracy of 99.79%.

研究の動機と目的

複雑で見た目が似たフルーツを含む実世界の応用に適した、頑健なフルーツ認識システムの開発を目的とする。
隠れ層アーキテクチャと学習エポック数の変化が分類精度に与える影響を調査することを目的とする。
Fruits-360データセット（25種類のフルーツと17,823枚の画像を含む）を用いて、ネットワークのパフォーマンス最適化を図ることを目的とする。
さまざまな構成における学習損失と検証損失のトレンドを分析し、モデルの汎化性能を保証することを目的とする。
自動フルーツ識別システムへの導入に適した高精度分類を達成することを目的とする。

提案手法

複数の隠れ層を備えた深層畳み込みニューラルネットワーク（CNN）を設計し、各層に畳み込み層、プーリング層、および全結合層を含めた。
Fruits-360データセットを前処理し、学習用（80%）とテスト用（20%）に分割して、モデルの汎化性能を評価した。
複数の隠れ層構成とエポック数の組み合わせを学習・比較し、最適なパフォーマンスを特定した。
最適化には、適応的学習率を備えた確率的勾配降下法を用い、隠れ層にはReLU活性化関数を適用した。
学習セットおよびテストセットにおける精度と損失指標を用いて、モデルのパフォーマンスを評価した。
ハイパーパramータチューニングは、深さ（隠れ層の数）と学習期間（エポック数）に焦点を当て、過学習と未学習のバランスを図った。

実験結果

リサーチクエスチョン

RQ1CNNにおける隠れ層の数が、フルーツ認識の分類精度にどのように影響するか？
RQ2Fruits-360データセットにおけるテスト精度を最大化するための、隠れ層と学習エポック数の最適な組み合わせは何か？
RQ3異なるネットワークアーキテクチャと学習期間における、学習損失と検証損失の変動はどのように変化するか？
RQ4視覚的特徴が重複する多様なフルーツ分類タスクにおいて、CNNがほぼ完璧なテスト精度を達成できるか？
RQ5アーキテクチャの深さが、フルーツ画像分類におけるモデルの収束性と汎化性能に与える影響は何か？

主な発見

提案されたCNNは、Fruits-360データセットで100%のテスト精度、99.79%の学習精度を達成した。
特定の隠れ層構成と100エポックの学習により最高の精度が達成され、最適な深さと学習期間が示された。
学習損失はエポックに伴い安定的に低下し、検証損失も低く保たれたため、効果的な汎化と最小限の過学習が確認された。
モデルは、視覚的類似性や重複するフルーツの出現に対して強く、特に重量計のシナリオにおいて優れた耐性を示した。
25種類のフルーツすべてのカテゴリで一貫したパフォーマンスを示し、どのクラスに対しても顕著な精度低下は見られなかった。
本研究は、十分な学習エポック数を伴うより深いアーキテクチャが、フルーツ認識タスクでほぼ完璧な精度を達成できることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。