Skip to main content
QUICK REVIEW

[论文解读] Devnagari document segmentation using histogram approach

Vikas J. Dongre, Vijay H. Mankar|arXiv (Cornell University)|Sep 6, 2011
Handwritten Text Recognition Techniques参考文献 10被引用 37
一句话总结

本文提出一种基于直方图的方法,用于将天城文脚本文档分割为行、词和单个字符,解决了复杂连字和符号带来的挑战。该方法利用垂直和水平投影轮廓检测行和词的边界,在真实天城文文档上实现了高精度分割,有效处理了连笔和叠字符形。

ABSTRACT

Document segmentation is one of the critical phases in machine recognition of any language. Correct segmentation of individual symbols decides the accuracy of character recognition technique. It is used to decompose image of a sequence of characters into sub images of individual symbols by segmenting lines and words. Devnagari is the most popular script in India. It is used for writing Hindi, Marathi, Sanskrit and Nepali languages. Moreover, Hindi is the third most popular language in the world. Devnagari documents consist of vowels, consonants and various modifiers. Hence proper segmentation of Devnagari word is challenging. A simple histogram based approach to segment Devnagari documents is proposed in this paper. Various challenges in segmentation of Devnagari script are also discussed.

研究动机与目标

  • 解决由于天城文脚本复杂的连字和符号导致的准确分割挑战。
  • 开发一种鲁棒且计算高效的天城文文档分割方法,将文档分为行、词和单个字符。
  • 通过确保精确的符号级分割,提升后续字符识别系统的性能。

提出的方法

  • 该方法利用垂直投影轮廓检测字符和词之间的垂直间隙。
  • 应用水平投影轮廓通过分析垂直强度变化来识别行分隔。
  • 采用两阶段分割流程,先分离行,再将每行分割为词和单个字符。
  • 对投影轮廓应用阈值技术,以区分字符间、词间和行间空隙。
  • 通过分析局部强度变化和空间聚类,处理叠合和连笔形式。
  • 在真实天城文文档图像上评估该算法,以验证其在自然变化下的鲁棒性。

实验结果

研究问题

  • RQ1如何利用简单、基于直方图的技术有效实现天城文文档分割?
  • RQ2由于复杂的字符形式和符号,天城文脚本分割面临哪些关键挑战?
  • RQ3基于直方图的方法能否在真实天城文文档中可靠地区分行、词和单个字符?
  • RQ4与现有方法相比,该方法在准确性和计算效率方面表现如何?

主要发现

  • 基于直方图的方法能以高精度将天城文文档分割为行、词和单个字符。
  • 通过利用投影轮廓中的强度变化,该方法有效处理了连笔和叠合字符形式。
  • 该方法在具有不同质量和版式的真实文档图像上表现出强鲁棒性。
  • 通过在垂直和水平投影轮廓上应用自适应阈值,提升了分割精度。
  • 该技术计算效率高,适用于实时或嵌入式文档处理系统。
  • 研究证实,当结合空间分析时,基于直方图的方法对复杂脚本(如天城文)是可行的。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。