Skip to main content
QUICK REVIEW

[论文解读] Enhanced computation method of topological smoothing on shared memory parallel machines

Ramzi Mahmoudi, Mohamed Akil|arXiv (Cornell University)|Mar 30, 2016
Digital Image Processing Techniques参考文献 21被引用 66
一句话总结

本文提出一种基于共享内存并行机器的并行拓扑平滑方法,用于二维二值图像,采用一种新颖的拆分、分发与合并(SDM)策略,实现高效且保持拓扑结构的计算。该方法在8核系统上实现了5.2倍的加速比,缓存命中率达到70%,显著优于串行方法的性能与内存管理表现。

ABSTRACT

To prepare images for better segmentation, we need preprocessing applications, such as smoothing, to reduce noise. In this paper, we present an enhanced computation method for smoothing 2D object in binary case. Unlike existing approaches, proposed method provides a parallel computation and better memory management, while preserving the topology (number of connected components) of the original image by using homotopic transformations defined in the framework of digital topology. We introduce an adapted parallelization strategy called split, distribute and merge (SDM) strategy which allows efficient parallelization of a large class of topological operators. To achieve a good speedup and better memory allocation, we cared about task scheduling and managing. Distributed work during smoothing process is done by a variable number of threads. Tests on 2D grayscale image (512*512), using shared memory parallel machine (SMPM) with 8 CPU cores (2 Xeon E5405 running at frequency of 2 GHz), showed an enhancement of 5.2 with cache success rate of 70%.

研究动机与目标

  • 为解决图像预处理中串行拓扑平滑的性能瓶颈。
  • 实现在共享内存架构上拓扑保持平滑的高效并行化。
  • 改进并行拓扑算子中的内存管理与任务调度。
  • 在图像平滑过程中保持连通分量数量(即拓扑结构)不变。
  • 开发一种可扩展且可重用的并行化策略,适用于广泛类别的拓扑算子。

提出的方法

  • 提出一种拆分、分发与合并(SDM)策略,将图像划分为区域以实现并行处理。
  • 利用数字拓扑中的同伦变换确保平滑过程中的拓扑结构保持不变。
  • 将图像区域分配到共享内存并行机器(SMPM)上的可变数量线程上。
  • 采用动态任务调度与内存管理,减少资源争用并提升缓存利用率。
  • 在非重叠图像片段上并行应用平滑操作,随后通过边界一致性合并结果。
  • 优化内存访问模式,在8核系统上实现70%的缓存命中率。

实验结果

研究问题

  • RQ1如何在保持图像拓扑结构的前提下,高效并行化共享内存架构上的拓扑平滑?
  • RQ2何种并行化策略能够实现在拓扑图像处理中高加速比与有效的内存管理?
  • RQ3缓存效率与任务调度在多线程拓扑算子中能在多大程度上提升性能?
  • RQ4所提出的SDM策略是否可推广至其他保持拓扑结构的图像算子?
  • RQ5在现代共享内存系统上,该方法在加速比与内存效率方面可实现多大性能提升?

主要发现

  • 所提方法在搭载2.0 GHz Xeon E5405处理器的8核共享内存系统上实现了5.2倍加速比。
  • 通过使用同伦变换,该方法保持了拓扑结构,确保连通分量数量不变。
  • 实现了70%的缓存命中率,表明内存访问优化效果显著。
  • SDM策略实现了高效的负载均衡,并在并行执行过程中减少了内存争用。
  • 该方法具有可扩展性,可应用于远超平滑操作的广泛拓扑算子类别。
  • 结果表明,与串行实现相比,该方法在保证拓扑保真性的同时实现了显著的性能提升。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。