Skip to main content
QUICK REVIEW

[論文レビュー] P*: A Model of Pilot-Abstractions

André Luckow, Mark Santcroos|arXiv (Cornell University)|Jul 27, 2012
Distributed and Parallel Computing Systems参考文献 15被引用数 25
ひとこと要約

本論文は、分散サイバインfraストラクチャ全体にわたる多様な実装を統合する、最小限かつ完全な概念的モデルP*を紹介する。Condor-G や DIANE といったフレームワークを P* にマッピングすることで、相互運用性のための共通基盤を確立し、ポータブルなパイлотAPIを用いて検証し、複数のフレームワークを同時に使用可能にすることで、グリッドおよびクラウドにおける一貫性、拡張性、スケーラビリティに優れた実行を実現する。

ABSTRACT

Pilot-Jobs support effective distributed resource utilization, and are arguably one of the most widely-used distributed computing abstractions - as measured by the number and types of applications that use them, as well as the number of production distributed cyberinfrastructures that support them. In spite of broad uptake, there does not exist a well-defined, unifying conceptual model of Pilot-Jobs which can be used to define, compare and contrast different implementations. Often Pilot-Job implementations are strongly coupled to the distributed cyber-infrastructure they were originally designed for. These factors present a barrier to extensibility and interoperability. This pa- per is an attempt to (i) provide a minimal but complete model (P*) of Pilot-Jobs, (ii) establish the generality of the P* Model by mapping various existing and well known Pilot-Job frameworks such as Condor and DIANE to P*, (iii) derive an interoperable and extensible API for the P* Model (Pilot-API), (iv) validate the implementation of the Pilot-API by concurrently using multiple distinct Pilot-Job frameworks on distinct production distributed cyberinfrastructures, and (v) apply the P* Model to Pilot-Data.

研究の動機と目的

  • パイロットジョブの統一された概念的モデルの欠如が、分散サイバインフラストラクチャ間の相互運用性および拡張性を阻害しているという問題に対処する。
  • 多様な実装を網羅する最小限かつ完全なモデル(P*)を提供し、パイロットジョブの本質的意味を捉える。
  • Condor-G、DIANE、BigJob などの既存のパイロットジョブフレームワークを比較・対比できる共通の分析フレームワークを確立する。
  • P* モデルに基づいて設計・検証された相互運用性のあるパイロットAPIを提供し、生産環境インフラストラクチャ上で複数のパイロットジョブフレームワークを同時に使用可能にする。
  • パイロットデータ抽象化をP*モデルに拡張し、分散実行における計算とデータの対称的取り扱いを可能にする。

提案手法

  • 複数のパイロットジョブフレームワークの分析を通じてP*モデルを導出し、パイロットジョブ、パイロットマネージャ、タスク管理などのコア抽象化を同定する。
  • 既存のフレームワーク(Condor-G/Glide-in、DIANE、BigJob)をP*モデルにマッピングすることで、意味的整合性および概念的統一性を実証する。
  • 複数の下位のパイロットジョブ実装を抽象化する標準インターフェースとしてパイロットAPIを設計し、透明な相互運用性を実現する。
  • 生産環境インフラストラクチャ(例:OSG、XSEDE、EGI)を用いてパイロットAPIを実装・検証し、異なるフレームワークの同時使用を実証する。
  • P*モデルをパイロットデータ(PD)抽象化へ拡張し、分散実行におけるデータと計算の対称的取り扱いを可能にする。
  • パフォーマンス測定および実世界のワークロードを用いて、パイロットAPIの効率性、スケーラビリティ、異種環境における相互運用性を評価する。

実験結果

リサーチクエスチョン

  • RQ1多様な実装間での比較・対比を可能にするために、最小限かつ完全かつ統合的なパイロットジョブの概念的モデルをどのように定義できるか?
  • RQ2Condor-G や DIANE といった既存のパイロットジョブフレームワークが、機能的損失なしに共通モデルに意味的にマッピング可能である範囲はどの程度か?
  • RQ3生産環境インフラストラクチャ上で複数のパイロットジョブフレームワークを同時に使用可能にするために、標準化され相互運用性のあるAPI(パイロットAPI)を設計・検証できるか?
  • RQ4パイロットジョブ抽象化をどのように一般化し、データ管理を統合することで、統一されたパイロットデータ抽象化を実現できるか?
  • RQ5異種で生産環境レベルの分散コンピューティング環境においてパイロットAPIを使用した場合のパフォーマンスおよびスケーラビリティへの影響は何か?

主な発見

  • P*モデルは、Condor-G/Glide-in、DIANE、BigJob などの多様なパイロットジョブフレームワークを、共通の概念的フレームワークにそのコア抽象化をマッピングすることで、成功裏に統合した。
  • パイロットAPIは、OSG や XSEDE などの生産環境インフラストラクチャ上で、異なるパイロットジョブフレームワーク(例:Condor-G と DIANE)を同時に相互運用可能にすることができ、これが初めての同時相互運用の実証である。
  • パフォーマンス測定の結果、パイロットAPIは、動的リソース配分および柔軟なスケジューリングの利点を活かした、効率的かつスケーラブルなデータ集約ワークロードの実行をサポートしていることが示された。
  • P*モデルにパイロットデータ抽象化を拡張することで、計算とデータの対称的取り扱いが可能となり、今後のデータ/計算のアフィニティおよび配置戦略に関する研究を支援する基盤が整った。
  • パイロットAPIは、生産規模の科学的ワークフローに導入されており、多様な分散サイバインフラストラクチャにおける実用的有用性および堅牢性が検証された。
  • 本研究では、パイロットジョブフレームワークがしばしばそのネイティブインフラストラクチャ(例:Condor-G と OSG)に強く結合されていることが判明したが、P*モデルはこうした結合性を克服するための重要な抽象化レイヤーを提供し、ポータビリティと再利用性を実現する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。