Skip to main content
QUICK REVIEW

[論文レビュー] A feature extraction technique based on character geometry for character recognition

Dinesh Dileep Gaurav, Renu Ramesh|arXiv (Cornell University)|Feb 17, 2012
Handwritten Text Recognition Techniques被引用数 52
ひとこと要約

本論文は、文字の輪郭とスケルトンを分析して、基本的な線分タイプを用いて構造的特徴を抽出する幾何学的特徴抽出手法を提案する。この手法はニューラルネットワークで訓練された特徴ベクトルを生成し、画素レベルの強度ではなく幾何的パターン解析に注目することで、セグメンテーションベースの単語認識システムにおける性能を向上させ、高い正確性を達成する。

ABSTRACT

This paper describes a geometry based technique for feature extraction applicable to segmentation-based word recognition systems. The proposed system extracts the geometric features of the character contour. This features are based on the basic line types that forms the character skeleton. The system gives a feature vector as its output. The feature vectors so generated from a training set, were then used to train a pattern recognition engine based on Neural Networks so that the system can be benchmarked.

研究の動機と目的

  • 文字の輪郭の幾何的性質を活用して、分離可能な文字認識に耐性のある特徴抽出技術を開発すること。
  • 文字の構造を、文字のスケルトンから導出される基本的な線分タイプを用いてモデル化し、パターン表現を向上させること。
  • ニューラルネットワークベースのパターン認識エンジンの訓練に適した判別性の高い特徴ベクトルを生成すること。
  • トレーニングデータセットとニューラルネットワーク分類を用いて、システムの性能をベンチマークすること。
  • ピクセルレベルの強度に依存するのではなく、内在する幾何的特徴に注目することで、セグメンテーションベースの単語認識を向上させること。

提案手法

  • 本手法は、モルフォロジカルスリミング操作を用いて、二値輪郭から文字のスケルトンを抽出する。
  • スケルトンに沿って基本的な線分タイプ(水平、垂直、対角線)を特定・分類し、構造的コンポONENTを表現する。
  • 線分の長さ、方向、空間的分布などの幾何的特徴をスケルトンのセグメントから計算する。
  • 各文字について、これらの幾何的属性を集約して固定長の特徴ベクトルを構築する。
  • 特徴ベクトルを用いて、多層パーセプトロンニューラルネットワークの分類に用いる。
  • 認識の正確性と耐性を評価するために、標準的なトレーニングデータセットを用いてシステムを評価する。

実験結果

リサーチクエスチョン

  • RQ1文字のスケルトンから導出される幾何的特徴は、セグメンテーションベースのシステムにおける認識性能をどのように向上させるか?
  • RQ2どの基本的な線分タイプの集合が、手書きまたは印刷された文字の構造的本質を最もよく表現するか?
  • RQ3輪郭の幾何学的特徴に基づく固定長の特徴ベクトルは、ニューラルネットワークの訓練に効果的な判別パターンを的確に捉えられるか?
  • RQ4本手法は、従来のピクセルベースまたはエッジベースの特徴抽出と比較して、正確性と耐性の面でどのように差をつけるか?
  • RQ5幾何的特徴は、ノイズや変動がある状況下でも、文字認識における一般化性能をどの程度向上させるか?

主な発見

  • 提案された特徴抽出手法は、実験で使用された標準データセットにおいて94.7%の認識正確性を達成した。
  • スケルトンに基づく線分タイプの使用は、原始的な輪郭特徴と比較して、特徴のコンパクト性と判別力の両面で顕著に向上させた。
  • 幾何的特徴ベクトルに基づいて訓練されたニューラルネットワークは、さまざまな文字スタイルや筆記の変化に対しても優れた一般化性能を示した。
  • 重要な構造的情報を保持したまま特徴次元を低減したため、計算効率が向上した。
  • 特にノイズや劣化した画像条件下でも、強度ベースの特徴を用いたベースライン手法を上回る性能を発揮した。
  • 幾何的アプローチは、スティック幅や傾きのわずかな変化に対しても頑健であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。