Skip to main content
QUICK REVIEW

[論文レビュー] Devnagari document segmentation using histogram approach

Vikas J. Dongre, Vijay H. Mankar|arXiv (Cornell University)|Sep 6, 2011
Handwritten Text Recognition Techniques参考文献 10被引用数 37
ひとこと要約

この論文では、複雑な結合子や記号による影響を受けるデーヴァナーガリー文字の文書を、線、単語、個々の文字に分離するためのヒストグラムベースの手法を提案している。この手法は垂直および水平の投影プロファイルを用いて線および単語の境界を検出する。実際のデーヴァナーガリー文書において、草書体および積み上げられた文字形に対しても高い正確性を達成している。

ABSTRACT

Document segmentation is one of the critical phases in machine recognition of any language. Correct segmentation of individual symbols decides the accuracy of character recognition technique. It is used to decompose image of a sequence of characters into sub images of individual symbols by segmenting lines and words. Devnagari is the most popular script in India. It is used for writing Hindi, Marathi, Sanskrit and Nepali languages. Moreover, Hindi is the third most popular language in the world. Devnagari documents consist of vowels, consonants and various modifiers. Hence proper segmentation of Devnagari word is challenging. A simple histogram based approach to segment Devnagari documents is proposed in this paper. Various challenges in segmentation of Devnagari script are also discussed.

研究の動機と目的

  • 複雑な結合子や記号による影響を受けるデーヴァナーガリー文字の正確なセグメンテーションの課題に対処すること。
  • デーヴァナーガリー文書を線、単語、個々の文字に分離する、強固で計算的に効率的な手法を開発すること。
  • 正確な記号レベルのセグメンテーションを確保することで、その後続の文字認識システムの性能を向上させること。

提案手法

  • 垂直投影プロファイルを用いて、文字および単語間の垂直ギャップを検出する。
  • 水平投影プロファイルを用いて、垂直方向の強度変動を分析することで、行の区切りを特定する。
  • 2段階のセグメンテーションプロセスを採用し、まず線を分離し、その後各線を単語および個々の文字に分割する。
  • 投影プロファイルにしきい値処理を適用することで、文字間、単語間、行間の空間を区別する。
  • 局所的な強度遷移と空間クラスタリングの分析により、積み上げられた形および草書体の形に対応する。
  • 実際のデーヴァナーガリー文書画像を用いてアルゴリズムの妥当性を検証し、自然な変動下での頑健性を検証した。

実験結果

リサーチクエスチョン

  • RQ1単純なヒストグラムベースの技術を用いて、どのようにしてデーヴァナーガリー文書のセグメンテーションを効果的に達成できるか?
  • RQ2複雑な文字形と記号の影響により、デーヴァナーガリー文字のセグメンテーションにおいてどのような主な課題が生じるか?
  • RQ3ヒストグラムベースの手法は、実際のデーヴァナーガリー文書において、線、単語、個々の文字を信頼性高く分離できるか?
  • RQ4精度および計算効率の観点から、提案手法は既存の手法と比べてどのように差をつけることができるか?

主な発見

  • ヒストグラムベースの手法は、高い正確性でデーヴァナーガリー文書を線、単語、個々の文字にセグメンテーションできた。
  • 投影プロファイルにおける強度遷移を活用することで、このアプローチは草書体および積み上げられた文字形に対しても効果的に対応した。
  • 品質やレイアウトにばらつきがある実際の文書画像に対しても、この手法は頑健であることが示された。
  • 垂直および水平の投影プロファイルに適応型しきい値処理を適用することで、セグメンテーションの正確性が向上した。
  • この手法は計算的に効率的であり、リアルタイムまたは組み込み型文書処理システムに適している。
  • 本研究は、空間解析と組み合わせたヒストグラムベースの手法が、デーヴァナーガリーのような複雑な文字体系に対しても実用的であることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。