Skip to main content
QUICK REVIEW

[論文レビュー] Temporal Load Imbalance on Ondes3D Seismic Simulator for Different Multicore Architectures

Ana Luisa Veroneze Solórzano, Philippe O. A. Navaux|arXiv (Cornell University)|Sep 17, 2024
Distributed and Parallel Computing Systems被引用数 6
ひとこと要約

論文は、Ondes3D地震シミュレータの性能を八つのマルチコアアーキテクチャで評価し、時間的負荷不均衡とアーキテクチャの選択がMPIランクの負荷分布とカーネル実行に与える影響に焦点を当てている。

ABSTRACT

The variety of today's multicore architectures motivates researchers to explore parallel scientific applications on different platforms. Load imbalance is one performance issue that can prejudice parallel applications from exploiting the computational power of these platforms. Ondes3D is a scientific application for seismic wave simulation used to assess the geological impact of earthquakes. Its parallelism relies on applying a regular domain decomposition in the geological domain provided and distributing each sub-domain to MPI ranks. Previous works investigate the significant spatial and temporal imbalance in Ondes3D and suggest new parallelization and load balancing techniques to minimize them. However, none explored its execution on different architectures. Our paper evaluates the performance of Ondes3D for two earthquake scenarios on eight different multicore architectures, including Intel, AMD, and ARM processors. We measure the load distribution per MPI rank, evaluate the temporal load imbalance, and compare the execution of the application's kernels. Our results show that the temporal load imbalance in Ondes3D depends on the architecture chosen, with some platforms minimizing such imbalance more effectively.

研究の動機と目的

  • 多様なマルチコアプラットフォーム上での並列地震波シミュレーションの研究を動機づける。
  • アーキテクチャの違いがOndes3Dの負荷バランスと並列性能にどのように影響するかを評価する。
  • 複数のプロセサファミリにわたるMPIランクごとの時間的負荷不均衡を定量化する。
  • 異なるアーキテクチャ上でのOndes3Dカーネルの実行特性を比較する。

提案手法

  • Ondes3DでサブドメインをMPIランクへ分配するために通常の領域分解を適用する。
  • 二つの地震シナリオに対してMPIランクごとの負荷分布を測定する。
  • eight マルチコアアーキテクチャ(Intel、AMD、ARM)をまたぐ時間的負荷不均衡を評価する。
  • アーキテクチャ間でOndes3Dカーネルの実行を比較する。

実験結果

リサーチクエスチョン

  • RQ1Ondes3Dの時間的負荷不均衡は基盤となるマルチコアアーキテクチャに依存するのか?
  • RQ2どのアーキテクチャが時間的負荷不均衡を最小化するのか、そしてなぜか?
  • RQ3Ondes3Dのカーネル実行パターンは異なるプロセッサファミリ間でどのように異なるのか?
  • RQ4Ondes3Dのアーキテクチャ認識型並列化に対する指針は何か?

主な発見

  • Ondes3Dの時間的負荷不均衡は選択されたアーキテクチャに依存する。
  • 一部のプラットフォームは他よりも時間的不均衡をより効果的に最小化する。
  • アーキテクチャ間でOndes3Dカーネルの実行に観察可能な差がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。