Skip to main content
QUICK REVIEW

[論文レビュー] Automatic Recognition of Coal and Gangue based on Convolution Neural Network

Huichao Hong, Lixin Zheng|arXiv (Cornell University)|Dec 3, 2017
Mineral Processing and Grinding参考文献 7被引用数 25
ひとこと要約

本稿では、限定的な学習データを補うためにデータ拡張とトランスファーラーニングを組み合わせた変更版AlexNetモデルを用いて、自動コールドおよびゲイングー認識のためのCNNベースのシステムを提案する。従来のSVMおよびニューラルネットワークと比較して高い認識精度を達成し、最適化された画像前処理と領域ベースの学習により、産業的コールド選別応用において優れた性能を示している。

ABSTRACT

We designed a gangue sorting system,and built a convolutional neural network model based on AlexNet. Data enhancement and transfer learning are used to solve the problem which the convolution neural network has insufficient training data in the training stage. An object detection and region clipping algorithm is proposed to adjust the training image data to the optimum size. Compared with traditional neural network and SVM algorithm, this algorithm has higher recognition rate for coal and coal gangue, and provides important reference for identification and separation of coal and gangue.

研究の動機と目的

  • 不足した学習データによるコールドおよびゲイングー選別における認識精度の低さという課題に対処する。
  • 産業的コールド選別工場におけるコールドおよびゲイングーのリアルタイム同定を自動化するシステムを開発する。
  • コールドおよびゲイングーの特徴的な視覚的特性に合わせた深層学習技術を用いて分類性能を向上させる。
  • 画像入力を最適化するために、領域クリッピングとサイズ正規化を適用し、深層学習の学習効率を向上させる。
  • 畳み込みニューラルネットワークを用いた実用的でスケーラブルなソリューションを、コールド洗選工場への実装に提供する。

提案手法

  • コールドおよびゲイングー画像の特徴抽出および分類のためのベースモデルとして、変更版AlexNetアーキテクチャを採用した。
  • 学習データセットを人工的に拡張し、モデルの一般化能力を向上させるためのデータ拡張技術を適用した。
  • データ不足を補うために、事前学習済みAlexNetをコールドおよびゲイングーデータセット上で微調整することで、トランスファーラーニングを活用した。
  • 関連する画像パッチを抽出・リサイズし、一様なサイズにすることで、CNNへの最適な入力を得るためのオブジェクト検出および領域クリッピングアルゴリズムを実装した。
  • コールドおよびゲイングーのラベル付き画像を用いた教師あり学習により、エンドツーエンドの分類を可能にするためにモデルを訓練した。
  • 同一の評価条件下で、提案されたCNNモデルを従来のSVMおよび標準ニューラルネットワークベースラインと比較した。

実験結果

リサーチクエスチョン

  • RQ1深層畳み込みニューラルネットワークは、SVMのような従来の機械学習モデルよりも、コールドおよびゲイングー分類において高い認識精度を達成できるか?
  • RQ2学習データが限られている状況で、データ拡張およびトランスファーラーニングは、どの程度モデル性能を向上させるか?
  • RQ3提案された領域クリッピングおよび画像リサイズ技術は、CNNの入力最適化においてどの程度効果的か?
  • RQ4提案されたシステムは、実際のコールド洗選環境において、自動選別に効果的に導入可能か?
  • RQ5認識率および耐障害性の観点から、CNNベースの手法は従来手法と比較してどの程度優れているか?

主な発見

  • 提案されたCNNモデルは、従来のニューラルネットワークおよびSVMアルゴリズムよりも、コールドおよびゲイングーの認識率が高かった。
  • 限られた学習サンプルでも、データ拡張およびトランスファーラーニングにより、モデル性能が顕著に向上した。
  • 領域クリッピングおよび画像リサイズ手法により、モデルの学習効率と入力の一貫性が向上した。
  • 実世界のコールド選別データに対して、モデルは強力な一般化能力を示し、実用的な産業応用可能性を裏付けた。
  • 事前学習済みAlexNetを用いたトランスファーラーニングにより、学習時間の短縮と、ターゲットデータセットへの収束の向上が達成された。
  • 提案手法の全体的な認識精度は、ベースラインモデルを上回り、この分野における深層学習の有効性を確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。