Skip to main content
QUICK REVIEW

[논문 리뷰] Temporal Load Imbalance on Ondes3D Seismic Simulator for Different Multicore Architectures

Ana Luisa Veroneze Solórzano, Philippe O. A. Navaux|arXiv (Cornell University)|2024. 09. 17.
Distributed and Parallel Computing Systems인용 수 6
한 줄 요약

이 논문은 다양한 8개의 다중코어 아키텍처에서 Ondes3D 지진파 시뮬레이터의 성능을 평가하고, 시간적 부하 불균형과 아키텍처 선택이 MPI-rank 부하 분포 및 커널 실행에 미치는 영향을 중점적으로 분석한다.

ABSTRACT

The variety of today's multicore architectures motivates researchers to explore parallel scientific applications on different platforms. Load imbalance is one performance issue that can prejudice parallel applications from exploiting the computational power of these platforms. Ondes3D is a scientific application for seismic wave simulation used to assess the geological impact of earthquakes. Its parallelism relies on applying a regular domain decomposition in the geological domain provided and distributing each sub-domain to MPI ranks. Previous works investigate the significant spatial and temporal imbalance in Ondes3D and suggest new parallelization and load balancing techniques to minimize them. However, none explored its execution on different architectures. Our paper evaluates the performance of Ondes3D for two earthquake scenarios on eight different multicore architectures, including Intel, AMD, and ARM processors. We measure the load distribution per MPI rank, evaluate the temporal load imbalance, and compare the execution of the application's kernels. Our results show that the temporal load imbalance in Ondes3D depends on the architecture chosen, with some platforms minimizing such imbalance more effectively.

연구 동기 및 목표

  • 다양한 다중코어 플랫폼에서 병렬 지진파 시뮬레이션 연구를 촉진한다.
  • Ondes3D에서 아키텍처 차이가 부하 균형 및 병렬 성능에 어떠한 영향을 미치는지 평가한다.
  • 여러 프로세서 계열에서 MPI 랭크당 시간적 부하 불균형을 정량화한다.
  • 서로 다른 아키텍처에서 Ondes3D 커널의 실행 특성을 비교한다.

제안 방법

  • Ondes3D에서 서브도메인을 MPI 랭크에 분배하기 위해 규칙적인 도메인 분해를 적용한다.
  • 두 가지 지진 시나리오에 대한 MPI 랭크당 부하 분포를 측정한다.
  • 여덟 개의 다중코어 아키텍처(Intel, AMD, ARM)에 걸친 시간적 부하 불균형을 평가한다.
  • 아키텍처 간에 Ondes3D 커널의 실행을 비교한다.

실험 결과

연구 질문

  • RQ1Ondes3D의 시간적 부하 불균형은 기반 다중코어 아키텍처에 따라 어떻게 달라지는가?
  • RQ2어떤 아키텍처가 시간적 부하 불균형을 최소화하며 그 이유는 무엇인가?
  • RQ3서로 다른 프로세서 계열에서 Ondes3D 커널 실행 패턴은 어떻게 다른가?
  • RQ4Ondes3D의 아키텍처 인식 병렬화에 대해 어떤 가이드가 주어질 수 있는가?

주요 결과

  • Ondes3D의 시간적 부하 불균형은 선택된 아키텍처에 의존한다.
  • 일부 플랫폼은 다른 플랫폼보다 시간적 불균형을 더 효과적으로 최소화한다.
  • 아키텍처 간에 Ondes3D 커널의 실행에 관찰 가능한 차이가 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.