Skip to main content
QUICK REVIEW

[論文レビュー] Handwritten Bangla Basic and Compound character recognition using MLP and SVM classifier

Nibaran Das, Bindaban Das|arXiv (Cornell University)|Feb 22, 2010
Handwritten Text Recognition Techniques参考文献 12被引用数 80
ひとこと要約

本稿では、多層パーセプトロン(MLP)およびサポートベクターマシン(SVM)分類器を用いて、手書きバインガラ文字の基本的および合成文字を認識するハイブリッド機械学習手法を提案する。頻度の高い合成文字を段階的に優先することで、三重交差検証を用いた平均認識率79.25%を達成し、バインガラ文字の高複雑性および視覚的類似性に対処する。

ABSTRACT

A novel approach for recognition of handwritten compound Bangla characters, along with the Basic characters of Bangla alphabet, is presented here. Compared to English like Roman script, one of the major stumbling blocks in Optical Character Recognition (OCR) of handwritten Bangla script is the large number of complex shaped character classes of Bangla alphabet. In addition to 50 basic character classes, there are nearly 160 complex shaped compound character classes in Bangla alphabet. Dealing with such a large varieties of handwritten characters with a suitably designed feature set is a challenging problem. Uncertainty and imprecision are inherent in handwritten script. Moreover, such a large varieties of complex shaped characters, some of which have close resemblance, makes the problem of OCR of handwritten Bangla characters more difficult. Considering the complexity of the problem, the present approach makes an attempt to identify compound character classes from most frequently to less frequently occurred ones, i.e., in order of importance. This is to develop a frame work for incrementally increasing the number of learned classes of compound characters from more frequently occurred ones to less frequently occurred ones along with Basic characters. On experimentation, the technique is observed produce an average recognition rate of 79.25 after three fold cross validation of data with future scope of improvement and extension.

研究の動機と目的

  • 50種類の基本的および約160種類の合成クラスを含む、複雑で視覚的に類似した手書きバインガラ文字を認識する課題に対処すること。
  • 段階的学習フレームワークにおいて、最も頻度の高い合成文字を優先することで、認識の複雑さを低減すること。
  • 基本的文字から高頻度の合成文字へと段階的に拡張するインクリメンタル学習フレームワークを構築すること。
  • 高い変動性と形態的多様性によって特徴づけられる手書きバインガラ文字におけるOCR性能の向上を図ること。

提案手法

  • 識別的なパターンを捉えるために、手書きバインガラ文字画像に特徴抽出パイプラインを適用する。
  • データセットを頻度に基づいて合成文字を優先するように分割し、インクリメンタルな学習を可能にする。
  • 抽出された特徴量に対して、マルチレイヤーパーセプトロン(MLP)およびサポートベクターマシン(SVM)分類器を訓練および評価する。
  • 全文字クラスにわたる汎化性能を評価するために、三重交差検証を用いる。
  • 最も頻度の高い順に、合成文字クラスを段階的に追加する。
  • 全クラスにわたる総合的な平均認識率を計算するために、認識結果を集約する。

実験結果

リサーチクエスチョン

  • RQ1ハイブリッドMLPおよびSVMアプローチは、手書きバインガラ文字の基本的および合成文字を効果的に認識できるか?
  • RQ2文字頻度に基づくインクリメンタル学習が、認識精度にどのように影響するか?
  • RQ3バイナリの高頻度で複雑な文字セット、たとえばバインガラ文字の認識率として達成可能な水準は何か?
  • RQ4特徴表現と分類器選択は、視覚的に類似した合成文字の認識にどのように影響するか?
  • RQ5優先順位付けされた学習戦略は、多様性の高い手書き文字の認識の複雑さを低減できるか?

主な発見

  • 三重交差検証を用いた結果、提案手法は全基本的および合成バインガラ文字において平均認識率79.25%を達成した。
  • 頻度の高い合成文字の認識を優先することで、学習効率とモデルの安定性が向上した。
  • MLPとSVM分類器の組み合わせは、手書きバインガラ文字の高い変動性に対しても頑健であることが示された。
  • インクリメンタル学習フレームワークは、多数の合成文字クラスに対しても効果的にスケーリング可能であった。
  • 特徴工学の強化およびより大きな学習データの利用により、さらなる性能向上の余地が示唆された。
  • 本研究では、頻度に基づくクラス優先戦略が、手書き文字認識システムにおける複雑さの管理に実用的であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。