Skip to main content
QUICK REVIEW

[论文解读] A New Local Adaptive Thresholding Technique in Binarization

Tripty Singh, Sudipta Roy|arXiv (Cornell University)|Jan 25, 2012
Image Retrieval and Classification Techniques参考文献 26被引用 228
一句话总结

本文提出了一种新颖的局部自适应阈值化技术,用于图像二值化,通过利用积分和图像来高效计算局部均值,从而加速计算过程,无需进行标准差计算。通过消除与窗口大小相关的计算并避免昂贵的标准差运算,该方法在有效处理非均匀光照和噪声的退化文档图像的同时,处理速度优于传统的局部阈值化技术。

ABSTRACT

Image binarization is the process of separation of pixel values into two groups, white as background and black as foreground. Thresholding plays a major in binarization of images. Thresholding can be categorized into global thresholding and local thresholding. In images with uniform contrast distribution of background and foreground like document images, global thresholding is more appropriate. In degraded document images, where considerable background noise or variation in contrast and illumination exists, there exists many pixels that cannot be easily classified as foreground or background. In such cases, binarization with local thresholding is more appropriate. This paper describes a locally adaptive thresholding technique that removes background by using local mean and mean deviation. Normally the local mean computational time depends on the window size. Our technique uses integral sum image as a prior processing to calculate local mean. It does not involve calculations of standard deviations as in other local adaptive techniques. This along with the fact that calculations of mean is independent of window size speed up the process as compared to other local thresholding techniques.

研究动机与目标

  • 解决在非均匀光照和背景噪声条件下对退化文档图像进行二值化的挑战。
  • 克服传统局部自适应阈值化方法因依赖窗口标准差计算而导致的计算效率低下问题。
  • 通过消除均值计算中对窗口大小的依赖,减少局部阈值化中的处理时间。
  • 开发一种在显著提升速度的同时保持高二值化精度的技术,通过优化局部均值计算实现。

提出的方法

  • 利用积分和图像作为预处理步骤,以实现在任意矩形窗口内以常数时间计算局部均值。
  • 将局部均值用作每个像素的阈值,从而取代传统方法中用于阈值确定的标准差。
  • 避免显式计算标准差,这在传统局部自适应方法中是计算成本较高的操作。
  • 应用一种阈值化规则:若某像素的强度小于其局部均值,则分类为前景(黑色),否则为背景(白色)。
  • 利用数学性质:通过积分和图像,可在 O(1) 时间内计算矩形区域内像素值的总和。
  • 以滑动窗口方式处理图像,基于预先计算的积分和图像,按局部区域动态调整阈值。

实验结果

研究问题

  • RQ1如何在不牺牲二值化精度的前提下,使局部自适应阈值化更加计算高效?
  • RQ2能否通过消除标准差计算来提升局部阈值化中的处理速度?
  • RQ3使用积分和图像在多大程度上降低了自适应阈值化中局部均值计算的时间复杂度?
  • RQ4与现有局部阈值化技术相比,该方法在具有不同光照和噪声水平的退化文档图像上的表现如何?

主要发现

  • 由于避免了标准差计算,所提出的方法在处理速度上优于传统的局部自适应阈值化技术。
  • 使用积分和图像可实现与窗口大小无关的常数时间局部均值计算,显著降低了计算开销。
  • 该方法能有效处理具有非均匀光照和背景噪声的退化文档图像,生成清晰的二值化输出。
  • 通过消除均值计算中对窗口大小的依赖,算法在不同图像区域和尺度下均保持一致的性能。
  • 该技术在保持二值化质量的同时,相比现有局部自适应方法表现出更高的效率,尤其在具有挑战性的文档图像上。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。