Skip to main content
QUICK REVIEW

[論文レビュー] CapsNet comparative performance evaluation for image classification

Rinat Mukhometzianov, Juan Antonio Cabrera Carrillo|arXiv (Cornell University)|May 28, 2018
Advanced Neural Network Applications参考文献 22被引用数 79
ひとこと要約

本論文は CapsNet を Fisherfaces、LeNet、ResNet と4つのデータセットで比較評価し、CapsNet が大きな計算資源を要し、平均的には他の手法を下回ることを示す一方、より頑健なリソースと洗練されたアーキテクチャが得られれば有望である可能性を示唆している。

ABSTRACT

Image classification has become one of the main tasks in the field of computer vision technologies. In this context, a recent algorithm called CapsNet that implements an approach based on activity vectors and dynamic routing between capsules may overcome some of the limitations of the current state of the art artificial neural networks (ANN) classifiers, such as convolutional neural networks (CNN). In this paper, we evaluated the performance of the CapsNet algorithm in comparison with three well-known classifiers (Fisher-faces, LeNet, and ResNet). We tested the classification accuracy on four datasets with a different number of instances and classes, including images of faces, traffic signs, and everyday objects. The evaluation results show that even for simple architectures, training the CapsNet algorithm requires significant computational resources and its classification performance falls below the average accuracy values of the other three classifiers. However, we argue that CapsNet seems to be a promising new technique for image classification, and further experiments using more robust computation resources and re-fined CapsNet architectures may produce better outcomes.

研究の動機と目的

  • 多様な画像データセットにおける既存の分類器と比較したときの CapsNet の性能を評価する。
  • 従来の CNN ベースモデルと比較した CapsNet の学習計算リソース要件を調査する。
  • CapsNet の潜在的な利点と今後の研究の方向性について洞察を提供する。

提案手法

  • 4つの画像データセット(顔、交通標識、物体)で CapsNet を Fisherfaces、LeNet、ResNet と比較する。
  • 分類精度と学習資源要件を測定する。
  • CapsNet が単純なアーキテクチャとリソース制約でどのようにスケールするかを分析する。

実験結果

リサーチクエスチョン

  • RQ1複数のデータセットにおいて CapsNet の分類精度は Fisherfaces、LeNet、ResNet とどのように比較されるか?
  • RQ2他の分類器と比較して CapsNet の学習に必要な計算資源はどうか?
  • RQ3単純な設計の CapsNet アーキテクチャは競争力のある性能を達成するか、より良い結果のためにどのような改善が必要か?

主な発見

  • CapsNet の学習にはかなりの計算資源が必要である。
  • テストデータセットで CapsNet の平均分類精度は他の3つの分類器を下回る。
  • CapsNet は画像分類に有望に見えるが、より堅牢なリソースと洗練されたアーキテクチャによる改善の可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。