Skip to main content
QUICK REVIEW

[論文レビュー] Handwritten Arabic Numeral Recognition using a Multi Layer Perceptron

Nibaran Das, Ayatullah Faruk Mollah|arXiv (Cornell University)|Mar 9, 2010
Handwritten Text Recognition Techniques参考文献 5被引用数 27
ひとこと要約

本稿では、88の特徴(72個のシャドウ特徴と16個のオクタント特徴)からなる独自の特徴セットを用いて、手書きアラビア数字認識のためのマルチレイヤーパーセプトロン(MLP)分類器を提案する。3,000サンプルのデータセットを3分割交差検証で評価した結果、平均認識正答率は94.93%に達し、アラビア数字OCR応用分野において優れた性能を示している。

ABSTRACT

Handwritten numeral recognition is in general a benchmark problem of Pattern Recognition and Artificial Intelligence. Compared to the problem of printed numeral recognition, the problem of handwritten numeral recognition is compounded due to variations in shapes and sizes of handwritten characters. Considering all these, the problem of handwritten numeral recognition is addressed under the present work in respect to handwritten Arabic numerals. Arabic is spoken throughout the Arab World and the fifth most popular language in the world slightly before Portuguese and Bengali. For the present work, we have developed a feature set of 88 features is designed to represent samples of handwritten Arabic numerals for this work. It includes 72 shadow and 16 octant features. A Multi Layer Perceptron (MLP) based classifier is used here for recognition handwritten Arabic digits represented with the said feature set. On experimentation with a database of 3000 samples, the technique yields an average recognition rate of 94.93% evaluated after three-fold cross validation of results. It is useful for applications related to OCR of handwritten Arabic Digit and can also be extended to include OCR of handwritten characters of Arabic alphabet.

研究の動機と目的

  • 手書きアラビア数字は形状やサイズのばらつきが著しいため、その認識に課題が存在する。
  • アラビア手書き数字に特化した頑健な特徴表現の開発。
  • 専用のアラビア数字データセット上でマルチレイヤーパーセプトロン(MLP)分類器の性能を評価すること。
  • 全アラビア文字認識への拡張の基盤を確立すること。

提案手法

  • 88の特徴(72個のシャドウ特徴と16個のオクタント特徴)からなる特徴セットを設計し、手書き数字の空間的・構造的パターンを捉える。
  • シャドウ特徴は、数字画像を複数の方向に投影することで、ホコリの輪郭やストローク分布を捉える。
  • オクタント特徴は、数字の重心の周囲の8方向のセクターにわたる画素強度の分布から導出される。
  • バックプロパゲーション学習を用いたマルチレイヤーパーセプトロン(MLP)を、抽出された特徴ベクトルに基づいて数字を分類するように訓練する。
  • MLPは、隠れ層を備えたフィードフォワードアーキテクチャを用い、多クラス分類のためのソフトマックス出力層を持つ。
  • モデルの性能は、頑健性と一般化性能を確保するため、3分割交差検証を用いて評価される。

実験結果

リサーチクエスチョン

  • RQ1シャドウ特徴とオクタント特徴の組み合わせが、分類のための手書きアラビア数字の表現として効果的であるか。
  • RQ2他の手法と比較して、マルチレイヤーパーセプトロンは手書きアラビア数字認識においてどの程度の性能を示すか。
  • RQ3提案手法の認識正答率は、3,000サンプルの多様な手書きアラビア数字データセット上でどの程度か。
  • RQ4提案された特徴セットは、他の手書きアラビア文字認識タスクへの一般化にどの程度適しているか。

主な発見

  • 提案された88特徴(72個のシャドウ特徴と16個のオクタント特徴)の特徴セットは、手書きアラビア数字の構造的・空間的特徴を効果的に捉えている。
  • 3分割交差検証を経て、3,000サンプルのデータセット上でマルチレイヤーパーセプトロン分類器は94.93%の認識正答率を達成した。
  • 高い認識正答率は、特徴工学と分類器の組み合わせの有効性を示している。
  • 本システムは、全アラビア語体系の手書き文字認識への拡張の可能性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。