Skip to main content
QUICK REVIEW

[論文レビュー] Enhanced computation method of topological smoothing on shared memory parallel machines

Ramzi Mahmoudi, Mohamed Akil|arXiv (Cornell University)|Mar 30, 2016
Digital Image Processing Techniques参考文献 21被引用数 66
ひとこと要約

本論文は、共有メモリ並列マシンを用いて2値2次元画像の並列的トポロジカルスムージングを実現する手法を提案し、効率的でトポロジーを保存する計算を可能にする、新しいスプリット・ディストリビュート・マージ(SDM)戦略を採用している。8コアシステム上で70%のキャッシュ成功率を達成し、逐次的手法と比較して性能とメモリ管理が顕著に向上した。5.2倍のスループット向上を達成した。

ABSTRACT

To prepare images for better segmentation, we need preprocessing applications, such as smoothing, to reduce noise. In this paper, we present an enhanced computation method for smoothing 2D object in binary case. Unlike existing approaches, proposed method provides a parallel computation and better memory management, while preserving the topology (number of connected components) of the original image by using homotopic transformations defined in the framework of digital topology. We introduce an adapted parallelization strategy called split, distribute and merge (SDM) strategy which allows efficient parallelization of a large class of topological operators. To achieve a good speedup and better memory allocation, we cared about task scheduling and managing. Distributed work during smoothing process is done by a variable number of threads. Tests on 2D grayscale image (512*512), using shared memory parallel machine (SMPM) with 8 CPU cores (2 Xeon E5405 running at frequency of 2 GHz), showed an enhancement of 5.2 with cache success rate of 70%.

研究の動機と目的

  • 画像前処理における逐次的トポロジカルスムージングの性能ボトルネックを解消すること。
  • 共有メモリアーキテクチャ上でのトポロジーを保存するスムージングの効率的並列化を可能にすること。
  • 並列的トポロジカル演算子におけるメモリ管理とタスクスケジューリングを改善すること。
  • 画像スムージング中に連結成分の数(トポロジー)を維持すること。
  • 広範なトポロジカル演算子に適用可能なスケーラブルで再利用可能な並列化戦略を開発すること。

提案手法

  • 画像を領域に分割して並列処理を可能にする、スプリット・ディストリビュート・マージ(SDM)戦略を導入する。
  • デジタルトポロジーからのホモトピー変換を用いて、スムージング中におけるトポロジーの保存を保証する。
  • 共有メモリ並列マシン(SMPM)上で可変数のスレッドに画像領域を配分する。
  • 動的タスクスケジューリングとメモリ管理を採用し、競合を低減しキャッシュ効率を向上させる。
  • 重複のない画像セグメント上で並列にスムージング処理を実行し、境界の一貫性を保ったまま結果をマージする。
  • 8コアシステム上で70%のキャッシュ成功率を達成するよう、メモリアクセスパターンを最適化する。

実験結果

リサーチクエスチョン

  • RQ1共有メモリアーキテクチャ上で、画像のトポロジーを保存しつつ、効率的なトポロジカルスムージングの並列化はどのように実現できるか?
  • RQ2どのような並列化戦略が、トポロジカル画像処理における高いスループット向上と効果的なメモリ管理を可能にするか?
  • RQ3キャッシュ効率とタスクスケジューリングの向上は、並列的トポロジカル演算子の性能にどの程度寄与するか?
  • RQ4提案されたSDM戦略は、他のトポロジーを保存する画像演算子へ一般化可能か?
  • RQ5現代の共有メモリシステム上では、スループット向上とメモリ効率の観点から、どの程度の性能向上が達成可能か?

主な発見

  • 提案手法は、2.0 GHz Xeon E5405プロセッサを搭載した8コア共有メモリシステム上で5.2倍のスループット向上を達成した。
  • ホモトピー変換を用いることで、連結成分の数が変化しないトポロジーの保存が保証された。
  • 70%のキャッシュ成功率が達成され、効果的なメモリアクセス最適化が実現した。
  • SDM戦略により、効率的なロードバランシングが実現し、並列実行中のメモリ競合が低減された。
  • 本手法はスケーラブルであり、単なるスムージングにとどまらず、広範なトポロジカル演算子に適用可能である。
  • 結果として、逐次実装と比較して顕著な性能向上が示され、同時にトポロジーの正確性も保証された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。