[论文解读] Handwritten Arabic Numeral Recognition using a Multi Layer Perceptron
该论文提出一种用于手写阿拉伯数字识别的多层感知机(MLP)分类器,采用自定义的88个特征集——72个阴影特征和16个象限特征——从数字图像中提取。在3,000个样本的数据集上通过三重交叉验证评估,该方法实现了94.93%的平均识别准确率,表明其在阿拉伯数字OCR应用中表现出色。
Handwritten numeral recognition is in general a benchmark problem of Pattern Recognition and Artificial Intelligence. Compared to the problem of printed numeral recognition, the problem of handwritten numeral recognition is compounded due to variations in shapes and sizes of handwritten characters. Considering all these, the problem of handwritten numeral recognition is addressed under the present work in respect to handwritten Arabic numerals. Arabic is spoken throughout the Arab World and the fifth most popular language in the world slightly before Portuguese and Bengali. For the present work, we have developed a feature set of 88 features is designed to represent samples of handwritten Arabic numerals for this work. It includes 72 shadow and 16 octant features. A Multi Layer Perceptron (MLP) based classifier is used here for recognition handwritten Arabic digits represented with the said feature set. On experimentation with a database of 3000 samples, the technique yields an average recognition rate of 94.93% evaluated after three-fold cross validation of results. It is useful for applications related to OCR of handwritten Arabic Digit and can also be extended to include OCR of handwritten characters of Arabic alphabet.
研究动机与目标
- 为解决手写阿拉伯数字识别的挑战,其形状和尺寸变化显著。
- 开发一种专为手写阿拉伯数字设计的鲁棒特征表示方法。
- 评估多层感知机(MLP)分类器在专用阿拉伯数字数据集上的性能。
- 为将系统扩展至完整的阿拉伯文字识别奠定基础。
提出的方法
- 设计了包含72个阴影特征和16个象限特征的88个特征集,以捕捉手写数字中的空间和结构模式。
- 通过将数字图像在多个方向上投影来计算阴影特征,以捕捉轮廓和笔画分布。
- 象限特征是基于数字质心周围八个方向区域的像素强度分布推导得出。
- 使用反向传播学习训练一个具有前馈结构的多层感知机(MLP),基于提取的特征向量对数字进行分类。
- MLP采用包含隐藏层的前馈架构,并使用softmax输出层实现多类别分类。
- 通过三重交叉验证评估模型性能,以确保其稳健性和泛化能力。
实验结果
研究问题
- RQ1阴影特征与象限特征的组合能否有效表示手写阿拉伯数字以实现分类?
- RQ2与其它方法相比,多层感知机在识别手写阿拉伯数字方面的表现如何?
- RQ3所提出系统在包含3,000个手写阿拉伯数字样本的多样化数据集上的识别准确率是多少?
- RQ4所提出的特征集在多大程度上可泛化至其他手写阿拉伯字符识别任务?
主要发现
- 所提出的88个特征集(72个阴影特征和16个象限特征)有效捕捉了手写阿拉伯数字的结构和空间特征。
- 多层感知机分类器在3,000个样本的数据集上,经三重交叉验证后,识别准确率达到94.93%。
- 高识别率证明了特征工程与分类器组合在阿拉伯数字识别中的有效性。
- 该系统在扩展至完整阿拉伯文字手写字符识别方面展现出潜力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。