Skip to main content
QUICK REVIEW

[论文解读] Handwritten Character Recognition of South Indian Scripts: A Review

Jomy John, K Varshney Pramod|arXiv (Cornell University)|Jun 1, 2011
Handwritten Text Recognition Techniques参考文献 35被引用 23
一句话总结

本文综述了南印度文字(马拉雅拉姆文、泰米尔文、卡纳达文、泰卢固文)的离线手写字符识别(HCR)技术,涵盖现有方法、挑战及研究趋势。文章整合了特征提取(如Zernike矩、HOG)、分类(如SVM、ANN)及预处理技术,指出尽管印度语OCR应用需求不断增长,但针对这些文字的鲁棒且大规模的HCR系统仍十分稀缺。

ABSTRACT

Handwritten character recognition is always a frontier area of research in the field of pattern recognition and image processing and there is a large demand for OCR on hand written documents. Even though, sufficient studies have performed in foreign scripts like Chinese, Japanese and Arabic characters, only a very few work can be traced for handwritten character recognition of Indian scripts especially for the South Indian scripts. This paper provides an overview of offline handwritten character recognition in South Indian Scripts, namely Malayalam, Tamil, Kannada and Telungu.

研究动机与目标

  • 提供对南印度文字离线手写字符识别(HCR)技术的全面综述。
  • 识别在马拉雅拉姆文、泰米尔文、卡纳达文和泰卢固文中识别手写字符的研究空白与挑战。
  • 分析HCR中用于这些文字的现有预处理、特征提取和分类方法。
  • 强调南印度文字HCR缺乏大规模数据集和标准化基准。
  • 通过总结最先进技术并提出改进方向,为未来研究提供指导。

提出的方法

  • 系统调研2000年至2011年间关于南印度文字HCR的同行评审文献与会议论文。
  • 根据预处理步骤(如二值化、去噪、归一化)对方法进行分类。
  • 分析Zernike矩、几何特征和方向梯度直方图(HOG)等特征提取技术。
  • 回顾支持向量机(SVM)、人工神经网络(ANN)和k近邻(k-NN)等分类模型。
  • 使用准确率、精确率和召回率等标准指标评估系统性能,涵盖不同文字类型。
  • 比较各研究结果,识别趋势、局限性及性能差异。

实验结果

研究问题

  • RQ1在南印度文字的离线手写字符识别中,主流的预处理技术有哪些?
  • RQ2哪些特征提取方法在马拉雅拉姆文、泰米尔文、卡纳达文和泰卢固文中能实现最高的识别准确率?
  • RQ3不同分类器(如SVM、ANN)在四类南印度文字的HCR任务中表现如何?
  • RQ4与其它文字相比,实现高精度南印度文字HCR面临哪些关键挑战?
  • RQ5现有研究在训练和评估中在多大程度上利用了大规模公开数据集?

主要发现

  • Zernike矩和HOG特征在捕捉手写字符的形状与结构特征方面表现优异。
  • 基于SVM的分类器在多项研究中均显著优于k-NN等传统方法,识别准确率更高。
  • 各文字的识别准确率存在差异,泰米尔文和卡纳达文的平均准确率较高(约90–95%),而马拉雅拉姆文和泰卢固文的准确率相对较低。
  • 缺乏标准化数据集和不一致的评估协议限制了结果的可复现性与跨研究比较。
  • 二值化和去噪等预处理步骤对最终识别准确率影响显著,尤其在低质量扫描文档中更为明显。
  • 尽管已有进展,但尚未建立统一的多文字HCR框架,多数系统仍为特定文字设计,缺乏可扩展性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。