[論文レビュー] Relational Grid Monitoring Architecture (R-GMA)
R-GMAは、分散Grid情報ソースにわたる強力で柔軟な照会を可能にする、SQLベースのデータモデリングを活用した関係的グリッド監視アーキテクチャを提案する。Gridリソースを関係的テーブルとしてモデル化し、動的に最適なプロデューサーに照会をルーティングするメディエーターを使用することで、履歴照会、最新値照会、継続的照会をサポートする。非ブロッキングI/Oを採用することでスケーラブルなパフォーマンスを達成し、将来の拡張性を考慮したOGSAウェブサービスフレームワークへの統合を可能にする。
We describe R-GMA (Relational Grid Monitoring Architecture) which has been developed within the European DataGrid Project as a Grid Information and Monitoring System. Is is based on the GMA from GGF, which is a simple Consumer-Producer model. The special strength of this implementation comes from the power of the relational model. We offer a global view of the information as if each Virtual Organisation had one large relational database. We provide a number of different Producer types with different characteristics; for example some support streaming of information. We also provide combined Consumer/Producers, which are able to combine information and republish it. At the heart of the system is the mediator, which for any query is able to find and connect to the best Producers for the job. We have developed components to allow a measure of inter-working between MDS and R-GMA. We have used it both for information about the grid (primarily to find out about what services are available at any one time) and for application monitoring. R-GMA has been deployed in various testbeds; we describe some preliminary results and experiences of this deployment.
研究の動機と目的
- 分散的かつ動的なグリッドリソースにわたる複雑な照問をサポートするスケーラブルで拡張可能なグリッド情報および監視システムを設計すること。
- GGFのGMAの制限を克服するため、統一されたデータアクセスを可能にする関係的モデルの表現力を利用する。
- 履歴、最新、継続的照問といった多様な照問タイプを、パフォーマンスおよび信頼性特性が異なる専用のプロデューサータイプによってサポートすること。
- MDSなどの既存の監視システムおよび将来のOGSAベースのウェブサービスとの相互運用性を実現すること。
- 耐障害性とデータ耐久性を確保するため、レジリエントなデータ永続化および分散照問ルーティングを実現すること。
提案手法
- R-GMAは、プロデューサーがSQLのCREATE TABLE文で登録し、SQLのINSERT文でデータを発行する、コンシューマー・プロデューサー型モデルを採用する。
- システムは、照問タイプとデータ特性に基づき、最も適切なプロデューサーを動的に発見・ルーティングする中央集権的なメディエーターを使用する。
- 5種類の異なるプロデューサータイプを実装している:DataBaseProducer(永続的RDBMSストレージ)、StreamProducer(メモリ内ストリーミング)、ResilientStreamProducer(ディスクバックアップストリーミング)、LatestProducer(最新値キャッシュ)、CanonicalProducer(コードトリガーによる照問実行)。
- 照問タイプには履歴(時間範囲スキャン)、最新(現在値取得)、継続的(ストリームフィルタリング)があり、SQLによる複雑な述語をサポートする。
- システムはサーブレット上で構築されており、OGSAフレームワーク内でのウェブサービスへの移行が進行中であり、標準化された状態保持型グリッドサービスをサポートし、ライフサイクルおよびアイデンティティ管理を向上させる。
- パフォーマンス最適化には、非ブロッキングI/Oのためのjava.nioへの移行が行われており、I/Oバッファを軽減し、通常のトポロジーで最大150のサイトをサポート可能にする。
実験結果
リサーチクエスチョン
- RQ1分散グリッド監視に関係的データモデルを効果的に適用することで、表現力があり標準化された照問を可能にする方法は何か?
- RQ2動的かつ高速度のデータワークロード下での関係的グリッド監視システムのパフォーマンス特性とスケーラビリティの限界は何か?
- RQ3パフォーマンスを犠牲にせずに、ストリーミンググリッド監視システムで障害耐性とデータ耐久性を達成する方法は何か?
- RQ4MDSや将来のOGSAウェブサービスといった既存のグリッド監視基準とのシームレスな統合を可能にするアーキテクチャパターンは何か?
- RQ5多様な照問タイプを、異種のグリッド環境にわたって最も適切なデータソースに効率的にルーティングするメディエーター型アーキテクチャの実現方法は何か?
主な発見
- R-GMAは、仮想組織にわたるグリッド情報の統一的で関係的なビューを成功裏に実装し、分散データソースを単一論理RDBMSとして抽象化した。
- システムは、パフォーマンスおよび信頼性のニーズに応じた専用プロデューサーコンponentによって、履歴、最新、継続的の3種類の照問タイプをサポートする。
- パフォーマンステストの結果、java.nioによる非ブロッキングI/Oを採用することで、1つのトポロジー内に通常のグリッドサイト(各サイトにSEおよび3つのCEを含む)最大150か所をサポート可能であることが判明した。
- ボトルネックは主にI/O関連であり、java.nioへの移行によりスループットとスケーラビリティが顕著に向上した。
- メディエーターにより、複数のLatestProducerアーカイブにわたる分散実行が可能となり、個々のノードの負荷を軽減できる。
- R-GMAは、プライベートおよび主要なEDG開発テストベッドを含む複数のテストベッドにデプロイされており、動的かつ進化を続ける環境でも安定性と適応性を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。