Skip to main content
QUICK REVIEW

[論文レビュー] An Improved Feature Descriptor for Recognition of Handwritten Bangla Alphabet

Nibaran Das, Subhadip Basu|arXiv (Cornell University)|Jan 22, 2015
Handwritten Text Recognition Techniques参考文献 10被引用数 35
ひとこと要約

本稿では、修正されたシャドウ特徴、オクタントおよび重心特徴、距離ベースの特徴、およびクアッドツリーに基づく最長ラン特徴を組み合わせた改善された特徴記述子を提案する。この手法は、50文字クラスでMLP分類器を用いて85.40%の認識精度を達成し、前回の75.05%の精度を著しく上回っている。

ABSTRACT

Appropriate feature set for representation of pattern classes is one of the most important aspects of handwritten character recognition. The effectiveness of features depends on the discriminating power of the features chosen to represent patterns of different classes. However, discriminatory features are not easily measurable. Investigative experimentation is necessary for identifying discriminatory features. In the present work we have identified a new variation of feature set which significantly outperforms on handwritten Bangla alphabet from the previously used feature set. 132 number of features in all viz. modified shadow features, octant and centroid features, distance based features, quad tree based longest run features are used here. Using this feature set the recognition performance increases sharply from the 75.05% observed in our previous work [7], to 85.40% on 50 character classes with MLP based classifier on the same dataset.

研究の動機と目的

  • 手書きバングラ文字認識のためのより判別性の高い特徴セットの開発を目的とする。
  • 先行研究で達成された75.05%の認識精度を超える認識精度の向上を目的とする。
  • より良いパターン表現を実現するため、複数の幾何的および構造的特徴を統合することを目的とする。
  • 標準化されたデータセット上で提案された特徴セットの有効性を検証することを目的とする。
  • 提案された特徴記述子が従来の手法を上回ることを実証することを目的とする。

提案手法

  • 本手法は132の特徴を組み合わせる:修正されたシャドウ特徴、オクタントおよび重心特徴、距離ベースの特徴、およびクアッドツリーに基づく最長ラン特徴。
  • 修正されたシャドウ特徴は、スラント構造に対する感度を高めた垂直および水平投影特性を捉える。
  • オクタントおよび重心特徴は、文字画像内のスラントの空間的分布と中心傾向を表現する。
  • 距離ベースの特徴は、ストローク間およびストローク内空間的関係を定量化する。
  • 最長ラン特徴はクアッドツリー分解を用いて、支配的ストロークセグメントを同定する。
  • 完成した特徴ベクトルは、認識のためのマルチレイヤーパーセプトロン(MLP)分類器に供給される。

実験結果

リサーチクエスチョン

  • RQ1幾何的、構造的、空間的特徴を統合したハイブリッド特徴記述子は、手書きバングラ文字の認識精度を向上させることができるか?
  • RQ2提案された特徴セットは、従来の特徴セットと比較して、判別力に優れているか?
  • RQ3クアッドツリーに基づく最長ラン特徴の統合は、パターン表現にどの程度向上をもたらすか?
  • RQ450クラスのバングラアルファベットデータセット上で、新しい特徴記述子を用いることで認識精度がどの程度向上するか?
  • RQ5本手法は、筆跡スタイルの変化に対しても頑健性を維持するか?

主な発見

  • 提案された特徴記述子は、MLP分類器を用いて50のバングラ文字クラスで85.40%の認識精度を達成した。
  • これは、著者らの以前の研究で報告された75.05%という前回の最高精度を著しく上回るものである。
  • 修正されたシャドウ特徴およびクアッドツリーに基づく最長ラン特徴の導入が、性能向上に顕著な寄与をしている。
  • オクタント、重心、および距離ベースの特徴の組み合わせにより、類似した文字間の空間的判別力が向上した。
  • 同じデータセット上で強い汎化性能を示しており、その頑健性が確認された。
  • 同一データ上で定量的比較により確認されたように、本手法は従来の特徴セットを明確に上回っている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。