[论文解读] An MLP based Approach for Recognition of Handwritten 'Bangla' Numerals
该论文提出了一种基于多层感知机(MLP)的分类器,用于识别手写孟加拉数字,采用由24个阴影特征、16个质心特征和36个最长连续段特征组成的76维特征向量。在6,000个样本上通过三折交叉验证进行评估,该方法实现了96.67%的平均识别率,表明其在孟加拉文OCR应用中表现优异,并具备扩展至孟加拉文字识别的潜力。
The work presented here involves the design of a Multi Layer Perceptron (MLP) based pattern classifier for recognition of handwritten Bangla digits using a 76 element feature vector. Bangla is the second most popular script and language in the Indian subcontinent and the fifth most popular language in the world. The feature set developed for representing handwritten Bangla numerals here includes 24 shadow features, 16 centroid features and 36 longest-run features. On experimentation with a database of 6000 samples, the technique yields an average recognition rate of 96.67% evaluated after three-fold cross validation of results. It is useful for applications related to OCR of handwritten Bangla Digit and can also be extended to include OCR of handwritten characters of Bangla alphabet.
研究动机与目标
- 开发一种高效的手写孟加拉数字模式识别系统,该文字在南亚地区具有重要的语言和文化意义。
- 设计一种能够捕捉孟加拉数字结构与空间特征的特征集,以提升分类性能。
- 在包含6,000个手写孟加拉数字样本的真实数据集上,评估基于MLP的分类器性能。
- 为将该方法扩展至完整孟加拉字母识别(而不仅限于数字)奠定基础。
提出的方法
- 该系统使用由24个阴影特征、16个质心特征和36个最长连续段特征组成的76维特征向量,表示每个手写孟加拉数字。
- 阴影特征捕捉数字图像在垂直和水平投影方向上的像素密度分布。
- 质心特征源自像素的空间分布,反映数字的几何质心位置。
- 最长连续段特征用于识别多个方向上连续置位像素的最大长度,编码笔画模式。
- 使用提取的特征训练一个多层感知机(MLP)神经网络,将数字分类为十个孟加拉数字类别之一。
- 通过三折交叉验证评估模型性能,以确保其鲁棒性和泛化能力。
实验结果
研究问题
- RQ1结合阴影、质心和最长连续段特征的混合特征集是否能有效表示手写孟加拉数字以实现分类?
- RQ2当基于76维特征向量进行训练时,MLP分类器在识别手写孟加拉数字方面的表现如何?
- RQ3在6,000个样本的数据集上,通过三折交叉验证评估时,所提出系统的识别准确率是多少?
- RQ4该方法在多大程度上可扩展至识别手写孟加拉字母(而不仅限于数字)?
主要发现
- 所提出的基于MLP的分类器在6,000个手写孟加拉数字样本的数据集上实现了96.67%的平均识别率。
- 24个阴影特征、16个质心特征和36个最长连续段特征的组合,为数字结构提供了稳健的表征,显著提升了分类准确率。
- 三折交叉验证证实了模型在不同训练与测试划分下的稳定性与泛化能力。
- 该系统在孟加拉文光学字符识别(OCR)的实际应用中展现出强大潜力。
- 该方法论可扩展至手写孟加拉字母的识别,表明其应用范围可超越数字识别。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。