Skip to main content
QUICK REVIEW

[论文解读] Recognition of Handwritten Bangla Basic Characters and Digits using Convex Hull based Feature Set

Nibaran Das, Sandip Pramanik|arXiv (Cornell University)|Jan 1, 2009
Handwritten Text Recognition Techniques参考文献 17被引用 39
一句话总结

本文提出了一种基于凸包的新型特征集,包含125个属性,以提升孤立手写孟加拉文字符和数字的识别率。采用多层感知机(MLP)分类器,该方法在大规模数据集上对孟加拉文字符的识别率达到76.86%,对数字的识别率达到99.45%,证明了从凸包中提取的拓扑特征在孟加拉文OCR中的有效性。

ABSTRACT

In dealing with the problem of recognition of handwritten character patterns of varying shapes and sizes, selection of a proper feature set is important to achieve high recognition performance. The current research aims to evaluate the performance of the convex hull based feature set, i.e. 125 features in all computed over different bays attributes of the convex hull of a pattern, for effective recognition of isolated handwritten Bangla basic characters and digits. On experimentation with a database of 10000 samples, the maximum recognition rate of 76.86% is observed for handwritten Bangla characters. For Bangla numerals the maximum success rate of 99.45%. is achieved on a database of 12000 sample. The current work validates the usefulness of a new kind of feature set for recognition of handwritten Bangla basic characters and numerals.

研究动机与目标

  • 开发一种针对孤立手写孟加拉文字符与数字识别的鲁棒特征集。
  • 评估新提出的基于凸包的特征集在捕捉形状变化方面的性能。
  • 通过可扩展且计算高效的手段,实现对孟加拉文数字与基础字符的高识别准确率。
  • 通过从凸包中提取的拓扑特征,应对手写风格多变性的挑战。
  • 验证将局部子图像分析与全局凸包属性相结合,以提升模式表征效果的有效性。

提出的方法

  • 使用时间复杂度为O(n log n)的Graham扫描算法计算每个手写字符图像的凸包。
  • 基于凸包结构内部的海湾和湖泊区域,提取125个拓扑特征。
  • 通过凸包的质心将每个字符图像分割为四个子图像,以捕捉局部形状细节。
  • 为每个子图像重新计算凸包,以提取局部化的拓扑特征。
  • 使用学习率为0.8、动量为0.7的反向传播算法,训练包含一个隐藏层的多层感知机(MLP)。
  • 在10,000个字符样本和12,000个数字样本上进行评估,采用随机训练-测试划分。

实验结果

研究问题

  • RQ1基于凸包的拓扑特征能否有效表征手写孟加拉文字符与数字的形状变化?
  • RQ2与现有特征集相比,所提出的特征集在识别准确率方面表现如何?
  • RQ3在孟加拉文手写数据上,使识别性能最大化的MLP最优隐藏神经元数量是多少?
  • RQ4子图像分割与局部凸包分析在多大程度上提升了识别效果,相较于全局凸包特征?
  • RQ5所提出的方法是否能在不使用拒绝机制的情况下实现高准确率?

主要发现

  • 在MLP中使用60个隐藏神经元时,所提出的基于凸包的特征集对孟加拉文基本字符的最大识别率达到76.86%。
  • 在MLP中使用40个隐藏神经元时,对孟加拉文数字的系统峰值识别率达到99.45%。
  • 当隐藏神经元数量超过60个后,字符的识别率趋于平稳并略有下降,表明在此之后出现过拟合现象。
  • 在多个隐藏神经元数量下,数字的识别率始终保持在99%以上,表现出高度鲁棒性。
  • 该方法在相同字符数据库上优于以往方法,并在无先前可比工作的前提下,为数字识别设立了新基准。
  • 将子图像分析与凸包拓扑相结合,显著增强了特征表征能力,尤其在复杂字符形状的识别中表现突出。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。