QUICK REVIEW

[论文解读] Statistical Texture Features based Handwritten and Printed Text Classification in South Indian Documents

Mallikarjun Hangarge, KC Santosh|arXiv (Cornell University)|Mar 13, 2013

Handwritten Text Recognition Techniques参考文献 14被引用 25

一句话总结

该论文提出了一种基于统计纹理特征的方法，用于在南印度文字（卡纳达文、泰卢固文、马拉雅拉姆文和天城文）中以词为单位对手写体和印刷体文本进行分类。通过使用均值、熵和局部范围等特征，该方法在多个数据集上使用k-最近邻分类器实现了99.26%的平均分类准确率，表现出优异的性能，并可扩展至拉丁字母文字。

ABSTRACT

In this paper, we use statistical texture features for handwritten and printed text classification. We primarily aim for word level classification in south Indian scripts. Words are first extracted from the scanned document. For each extracted word, statistical texture features are computed such as mean, standard deviation, smoothness, moment, uniformity, entropy and local range including local entropy. These feature vectors are then used to classify words via k-NN classifier. We have validated the approach over several different datasets. Scripts like Kannada, Telugu, Malayalam and Hindi i.e., Devanagari are primarily employed where an average classification rate of 99.26% is achieved. In addition, to provide an extensibility of the approach, we address Roman script by using publicly available dataset and interesting results are reported.

研究动机与目标

开发一种稳健的方法，用于在词级别区分南印度文字中的手写体和印刷体文本。
评估统计纹理特征在捕捉文本分类判别性模式方面的有效性。
利用公开可用的数据将该方法扩展至拉丁字母文字，以增强其广泛适用性。
在包括卡纳达文、泰卢固文、马拉雅拉姆文和印地语（天城文）在内的多种南印度文字中实现高分类准确率。
为低资源文字环境下的多语言文档分析提供一种可扩展且可扩展的框架。

提出的方法

使用预处理和分割技术从扫描的南印度文档图像中提取单个单词。
为每个单词计算一组统计纹理特征，包括均值、标准差、平滑度、矩、均匀性、熵、局部范围和局部熵。
使用计算出的纹理统计量为每个单词构建特征向量，以表征其纹理特性。
应用k-最近邻（k-NN）分类器，基于特征向量区分手写体和印刷体文本。
在包含卡纳达文、泰卢固文、马拉雅拉姆文和天城文手写体与印刷体样本的多个数据集上验证该方法。
利用公开可用的数据集将该框架扩展至拉丁字母文字，以评估其泛化能力。

实验结果

研究问题

RQ1统计纹理特征能否有效区分南印度文字中的手写体和印刷体文本？
RQ2该方法在卡纳达文、泰卢固文和马拉雅拉姆文等多种南印度文字中的分类准确率如何？
RQ3当应用于公开可用数据集时，该方法在拉丁字母文字上的泛化能力如何？
RQ4在多语言文档分析中，哪些纹理特征对准确分类的贡献最为显著？
RQ5仅基于纹理特征训练的k-NN分类器能否在不依赖复杂深度学习架构的情况下实现高性能？

主要发现

所提出的方法在包括卡纳达文、泰卢固文、马拉雅拉姆文和印地语（天城文）在内的多个南印度文字中实现了99.26%的平均分类准确率。
局部熵和局部范围特征的使用显著提升了分类性能，能够捕捉细微的纹理变化。
k-NN分类器在未见过的单词样本上表现出强大的泛化能力，表明所选纹理特征具有鲁棒性。
该方法在拉丁字母文字上也表现出良好的泛化能力，在公开可用数据集上取得了有前景的结果，表明其可扩展性不仅限于印度文字。
如均值、标准差和熵等统计纹理特征在词级别区分文本风格方面具有高度判别性。
即使在手写风格和印刷质量存在差异的情况下，该方法仍能保持高准确率，表明其对噪声和文档来源多样性的强鲁棒性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。