[论文解读] Handwritten Bangla Alphabet Recognition using an MLP Based Classifier
本文提出一种基于多层感知机(MLP)的分类器,用于手写孟加拉字母识别,采用由24个阴影特征、16个质心特征和36个最长运行特征组成的76维特征集。该系统在训练数据上达到86.46%的准确率,在测试数据上达到75.05%的准确率,证明其可集成至完整的孟加拉文OCR系统中。
The work presented here involves the design of a Multi Layer Perceptron (MLP) based classifier for recognition of handwritten Bangla alphabet using a 76 element feature set Bangla is the second most popular script and language in the Indian subcontinent and the fifth most popular language in the world. The feature set developed for representing handwritten characters of Bangla alphabet includes 24 shadow features, 16 centroid features and 36 longest-run features. Recognition performances of the MLP designed to work with this feature set are experimentally observed as 86.46% and 75.05% on the samples of the training and the test sets respectively. The work has useful application in the development of a complete OCR system for handwritten Bangla text.
研究动机与目标
- 开发一种鲁棒的分类器,用于识别在南亚及全球广泛使用的手写孟加拉字母。
- 设计一种能有效捕捉手写孟加拉字符结构与空间特征的特征集。
- 评估MLP分类器在真实世界手写孟加拉文数据集上的性能,以应用于OCR。
- 为开发针对孟加拉文字的完整、可运行的OCR系统做出贡献。
提出的方法
- 系统使用由24个阴影特征、16个质心特征和36个最长运行特征组成的76维特征向量,表示每个手写孟加拉字符。
- 使用反向传播算法训练多层感知机(MLP)分类器,将特征向量映射到对应的孟加拉字母类别。
- 特征提取涉及对手写笔画的空间分布和结构模式进行分析。
- 训练与测试在真实手写样本收集的数据集上进行,性能通过分类准确率衡量。
- MLP架构包含多个隐藏层,以在特征空间中建模非线性决策边界。
- 系统在训练集和测试集上均进行评估,以衡量泛化性能。
实验结果
研究问题
- RQ1当使用自定义的76维特征集时,MLP分类器在识别手写孟加拉字母方面的有效性如何?
- RQ2哪些几何与结构特征的组合最能代表手写孟加拉字符以用于分类?
- RQ3MLP分类器在未见测试样本上的泛化性能如何?
- RQ4所提出的特征集与分类器能否集成至更大的孟加拉文OCR处理流程中?
主要发现
- MLP分类器在训练集上实现了86.46%的识别准确率,表明其对已见数据具有强大的学习能力。
- 在独立测试集上,系统实现了75.05%的识别准确率,证明其能够泛化到未见的手写样本。
- 由阴影特征、质心特征和最长运行特征组合而成的76维特征集,有效捕捉了孟加拉字符的判别性特征。
- 结果验证了在实际OCR应用中采用基于MLP的方法进行孟加拉文手写字符识别的可行性。
- 训练与测试准确率之间的差距表明,泛化性能仍有提升空间,可能通过数据增强或模型优化实现。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。