[论文解读] An Improved Feature Descriptor for Recognition of Handwritten Bangla Alphabet
本文提出了一种改进的特征描述子,结合了修改后的阴影特征、八分量与质心特征、基于距离的特征以及基于四叉树的最长运行特征,用于手写孟加拉字母识别。该方法在50个字符类别上使用MLP分类器实现了85.40%的识别准确率,显著优于先前75.05%的准确率。
Appropriate feature set for representation of pattern classes is one of the most important aspects of handwritten character recognition. The effectiveness of features depends on the discriminating power of the features chosen to represent patterns of different classes. However, discriminatory features are not easily measurable. Investigative experimentation is necessary for identifying discriminatory features. In the present work we have identified a new variation of feature set which significantly outperforms on handwritten Bangla alphabet from the previously used feature set. 132 number of features in all viz. modified shadow features, octant and centroid features, distance based features, quad tree based longest run features are used here. Using this feature set the recognition performance increases sharply from the 75.05% observed in our previous work [7], to 85.40% on 50 character classes with MLP based classifier on the same dataset.
研究动机与目标
- 为手写孟加拉字符识别开发更具区分性的特征集。
- 在先前工作的75.05%准确率基础上进一步提升识别准确率。
- 整合多种几何与结构特征,以实现更优的模式表征。
- 在标准数据集上验证所提特征集的有效性。
- 证明新特征描述子相较于现有方法的优越性。
提出的方法
- 该方法结合了132个特征:修改后的阴影特征、八分量与质心特征、基于距离的特征以及基于四叉树的最长运行特征。
- 修改后的阴影特征通过增强对笔画结构的敏感性,捕捉垂直与水平投影特性。
- 八分量与质心特征表示字符图像中笔画的空间分布与中心趋势。
- 基于距离的特征量化笔画间与笔画内空间关系。
- 通过四叉树分解提取最长运行特征,以识别主导笔画段。
- 完整特征向量输入多层感知机(MLP)分类器进行识别。
实验结果
研究问题
- RQ1结合几何、结构与空间特征的混合特征描述子能否提升手写孟加拉字符的识别准确率?
- RQ2所提出的特征集与先前特征集相比,在区分能力方面表现如何?
- RQ3基于四叉树的最长运行特征的整合在多大程度上增强了模式表征?
- RQ4在50类孟加拉字母数据集上,使用新特征描述子的识别准确率提升多少?
- RQ5所提方法在不同手写风格变化下是否保持鲁棒性?
主要发现
- 所提出的特征描述子在50个孟加拉字符类别上使用MLP分类器实现了85.40%的识别准确率。
- 该结果显著优于作者先前工作中报告的75.05%的最佳准确率。
- 修改后的阴影特征与基于四叉树的最长运行特征的引入对性能提升贡献显著。
- 八分量、质心与基于距离的特征组合增强了对字形相似字符的空间区分能力。
- 该特征集在先前实验所用数据集上表现出强大的泛化能力,证实了其鲁棒性。
- 定量比较结果在相同数据上证实,该方法明显优于早期特征集。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。