Skip to main content
QUICK REVIEW

[论文解读] A Hybrid NN/HMM Modeling Technique for Online Arabic Handwriting Recognition

Najiba Tagougui, Houcine Boubaker|arXiv (Cornell University)|Jan 2, 2014
Handwritten Text Recognition Techniques参考文献 17被引用 24
一句话总结

该论文提出了一种混合神经网络(NN)/隐马尔可夫模型(HMM)框架,用于在线阿拉伯文手写识别,采用Beta-椭圆分割策略提取笔画片段,并利用多层感知机(MLP)计算字符概率,随后由HMM进行解码。该系统在ADAB数据库上实现了96.4%的字符识别准确率,显著优于当前最先进方法。

ABSTRACT

In this work we propose a hybrid NN/HMM model for online Arabic handwriting recognition. The proposed system is based on Hidden Markov Models (HMMs) and Multi Layer Perceptron Neural Networks (MLPNNs). The input signal is segmented to continuous strokes called segments based on the Beta-Elliptical strategy by inspecting the extremum points of the curvilinear velocity profile. A neural network trained with segment level contextual information is used to extract class character probabilities. The output of this network is decoded by HMMs to provide character level recognition. In evaluations on the ADAB database, we achieved 96.4% character recognition accuracy that is statistically significantly important in comparison with character recognition accuracies obtained from state-of-the-art online Arabic systems.8

研究动机与目标

  • 通过结合神经网络与HMM的优势,提升在线阿拉伯文手写识别的识别准确率。
  • 开发一种鲁棒的分割方法,利用曲线速度分布中的极值点从动态输入中识别连续笔画。
  • 通过多层感知机(MLP)利用片段级别的上下文信息,以增强字符概率估计。
  • 将神经网络输出与HMM解码相结合,以提升字符级别的识别性能。
  • 在标准基准(ADAB数据库)上评估系统,并证明其在统计上优于现有方法。

提出的方法

  • 基于曲线速度分布中的极值点,使用Beta-椭圆策略将输入信号分割为连续笔画。
  • 在包含上下文信息的片段级特征上训练多层感知机(MLP),以预测字符概率。
  • 将MLP的输出输入至基于HMM的解码器,以确定最可能的字符序列。
  • 利用动态时间规整和HMM状态转移来建模手写过程中的时间变化。
  • 特征提取包括笔画的空间和时间特性,如方向、曲率和速度。
  • 混合架构结合了MLP的模式识别能力与HMM的序列建模能力。

实验结果

研究问题

  • RQ1与独立模型相比,混合NN/HMM模型是否能提升在线阿拉伯文手写识别中的字符识别准确率?
  • RQ2Beta-椭圆分割策略在从动态输入中分离有意义的手写笔画方面效果如何?
  • RQ3通过MLP引入片段级别的上下文信息,在多大程度上提升了字符概率估计的可靠性?
  • RQ4将MLP输出与HMM解码相结合,是否带来了统计上显著的性能提升?
  • RQ5所提出的系统与当前最先进的在线阿拉伯文手写识别系统相比,在标准基准上的表现如何?

主要发现

  • 所提出的混合NN/HMM模型在ADAB数据库上实现了96.4%的字符识别准确率。
  • 该识别准确率显著高于当前最先进的在线阿拉伯文手写识别系统。
  • Beta-椭圆分割方法能有效利用曲线速度分布中的极值点识别笔画边界。
  • 在MLP中使用片段级别的上下文信息,提升了字符概率估计的可靠性。
  • 将MLP输出与HMM解码相结合,增强了序列级别的识别性能。
  • 该系统在真实世界的在线阿拉伯文手写数据上表现出强鲁棒性和良好的泛化能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。