Skip to main content
QUICK REVIEW

[論文レビュー] Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

Xiao Han, Kashif Rasul|arXiv (Cornell University)|Aug 25, 2017
Advanced Neural Network Applications参考文献 3被引用数 6,056
ひとこと要約

Fashion-MNIST は 70,000 個の 28x28 グレースケールのファッション画像を 10 クラスにわたって導入し、機械学習アルゴリズムのベンチマークのための MNIST のドロップイン置換として機能させ、複数の分類器にわたる提供されたベースライン ベンチマークを備えています。

ABSTRACT

We present Fashion-MNIST, a new dataset comprising of 28x28 grayscale images of 70,000 fashion products from 10 categories, with 7,000 images per category. The training set has 60,000 images and the test set has 10,000 images. Fashion-MNIST is intended to serve as a direct drop-in replacement for the original MNIST dataset for benchmarking machine learning algorithms, as it shares the same image size, data format and the structure of training and testing splits. The dataset is freely available at https://github.com/zalandoresearch/fashion-mnist

研究の動機と目的

  • MNIST と互換性のある、現代の ML 手法にとってより難解なドロップインのベンチマークデータセットを提供する。
  • Zalando ファッションのサムネイルから 28x28 グレースケール画像へのデータパイプラインを説明する。
  • Fashion-MNIST に対するアルゴリズム選択を導くための予備的な分類ベンチマークを確立する。

提案手法

  • 10 クラスをまたぐ 70,000 枚の画像を用いる(訓練 60,000、テスト 10,000)クラスあたり 6,000 の訓練例。
  • Zalando のフロントルックのサムネイルを 28x28 グレースケール画像へ normalization 手順を含む変換パイプラインを通す。
  • 5-fold シャッフルで平均的なテスト精度を生成する幅広い分類器(DT、RF、SVM、KNN、ロジスティック回帰、MLP など)を評価する。
  • 公開リポジトリを提供し、拡張ベンチマーク結果と実験の詳細を共有する。

実験結果

リサーチクエスチョン

  • RQ1Fashion-MNIST は MNIST の置換として信頼性を保ちつつ、分類の難易度を高めることができるか。
  • RQ2同様のデータ形式と分割において、一般的な ML アルゴリズムは Fashion-MNIST と MNIST をどう比較して性能を示すか。
  • RQ3今後のアルゴリズム開発を導く基準となる初期のパフォーマンス範囲はどれか。

主な発見

分類器パラメータFashionMNIST
DecisionTreeClassifiercriterion= entropy max_depth= 10 splitter= best0.7980.873
DecisionTreeClassifiercriterion= entropy max_depth= 10 splitter= random0.7920.861
DecisionTreeClassifiercriterion= entropy max_depth= 50 splitter= best0.7890.886
DecisionTreeClassifiercriterion= entropy max_depth= 100 splitter= best0.7890.886
DecisionTreeClassifiercriterion= gini max_depth= 10 splitter= best0.7880.866
GaussianNBpriors= [0.1 x10]0.5110.524
GradientBoostingClassifiern_estimators= 100 loss= deviance max_depth= 100.8800.969
GradientBoostingClassifiern_estimators= 50 loss= deviance max_depth= 100.8720.964
KNeighborsClassifierweights= distance n_neighbors= 5 p= 10.8540.959
KNeighborsClassifierweights= distance n_neighbors= 9 p= 10.8540.955
LinearSVCloss= hinge C= 1 multi_class= ovr penalty= l20.8360.917
SVCC= 10 kernel= rbf0.8970.973
SVCC= 10 kernel= poly0.8910.976
MLPClassifieractivation= relu hidden_layer_sizes= [100]0.8710.972
RandomForestClassifiern_estimators= 100 criterion= entropy max_depth= 1000.8730.970
RandomForestClassifiern_estimators= 100 criterion= gini max_depth= 1000.8720.970
SVCC= 100 kernel= rbf0.8900.972
  • Fashion-MNIST は MNIST に比べて難易度の高いタスクを実現しつつ、MNIST 互換のデータ形式と分割を維持している。
  • 木構造系、SVM、k-NN、ロジスティック回帰、ニューラルネットなどのファミリごとに異なる性能を示す広範な分類器が評価された。
  • GradientBoosting、RandomForest、SVC の変種は Fashion-MNIST で高精度を達成しており、適切なチューニングによる強力な性能の可能性を示している。
  • データセットは既存の ML パイプラインで MNIST の代替として容易に置換できるよう設計されており、迅速なベンチマーク採用を可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。