Skip to main content
QUICK REVIEW

[論文レビュー] MonALISA : A Distributed Monitoring Service Architecture

H. B. Newman, I. Legrand|arXiv (Cornell University)|Jun 16, 2003
Distributed systems and fault tolerance参考文献 3被引用数 165
ひとこと要約

MonALISA は、JINI/Java および WSDL/SOAP を活用して、自己記述的で緩い結合のサービスを実現するスケーラブルで動的分散型の監視アーキテクチャを大規模なグリッドコンピューティングシステムに提供する。これにより、サービスの自動登録、発見、状態変化の通知が可能となる。システムは SNMP およびネットワーク性能監視を統合し、計算ノード、アプリケーション、エンドツーエンドのネットワーク動作を監視し、米国 CMS テストグリッドおよび VRVS リフレクターネットワークでリアルタイム監視を実証した。

ABSTRACT

The MonALISA (Monitoring Agents in A Large Integrated Services Architecture) system provides a distributed monitoring service. MonALISA is based on a scalable Dynamic Distributed Services Architecture which is designed to meet the needs of physics collaborations for monitoring global Grid systems, and is implemented using JINI/JAVA and WSDL/SOAP technologies. The scalability of the system derives from the use of multithreaded Station Servers to host a variety of loosely coupled self-describing dynamic services, the ability of each service to register itself and then to be discovered and used by any other services, or clients that require such information, and the ability of all services and clients subscribing to a set of events (state changes) in the system to be notified automatically. The framework integrates several existing monitoring tools and procedures to collect parameters describing computational nodes, applications and network performance. It has built-in SNMP support and network-performance monitoring algorithms that enable it to monitor end-to-end network performance as well as the performance and state of site facilities in a Grid. MonALISA is currently running around the clock on the US CMS test Grid as well as an increasing number of other sites. It is also being used to monitor the performance and optimize the interconnections among the reflectors in the VRVS system.

研究の動機と目的

  • 高エネルギー物理学共同研究における大規模で動的かつ地理的に分散されたグリッドコンピューティングシステムの監視課題に対処すること。
  • 自動サービス登録および発見をサポートするスケーラブルで緩い結合の監視アーキテクチャを設計すること。
  • 分散サービスおよびクライアント間で状態変化のリアルタイム通知を可能にすること。
  • SNMP やネットワーク性能アルゴリズムを含む、異種の監視ツールおよびプロトコルを統合すること。
  • グローバルなグリッドインfra構造にわたる計算およびネットワーク性能へのエンドツーエンドの可視性を提供すること。

提案手法

  • 本システムは、JINI および Java を基盤とする動的分散サービスアーキテクチャを採用し、自己記述的サービスをホストするマルチスレッド型ステーションサーバーを提供する。
  • 各サービスはネットワークに自律的に登録され、動的ルックアップメカニズムを通じてクライアントや他のサービスが発見可能となる。
  • イベント駆動型通知は、発行者-購読者モデルを用いて実装され、クライアントは状態変化イベントに購読し、自動的に更新を受信する。
  • フレームワークは既存の監視ツールを統合し、計算ノードおよび施設のシステムレベル監視に SNMP をサポートする。
  • ネットワーク性能は、分散サイト間のエンドツーエンド遅延およびスループットを追跡する組み込みアルゴリズムで監視される。
  • アーキテクチャは、サービス記述およびウェブサービス通信に WSDL/SOAP を使用しており、異種プラットフォーム間での相互運用性を実現する。

実験結果

リサーチクエスチョン

  • RQ1大規模で動的かつ異種コンponentを有するグリッドインfraに、分散監視システムがどのように効果的にスケーリングできるか。
  • RQ2分散監視環境において、自己発見および動的サービス登録を可能にするアーキテクチャパターンは何か。
  • RQ3緩い結合のサービス指向監視フレームワークにおいて、リアルタイムイベント通知をどのように効率的にサポートできるか。
  • RQ4統一された監視サービス内で、多様な監視ツールおよびプロトコルが相互運用するための統合メカニズムは何か。
  • RQ5このようなシステムが、グローバルなグリッド展開において、計算およびネットワーク性能のエンドツーエンド可視性をどの程度提供できるか。

主な発見

  • MonALISA は米国 CMS テストグリッドで24時間体制の継続的監視を実現し、生産規模環境での運用安定性を実証した。
  • システムはサービスの自動発見および動的登録を可能にし、手動設定の削減とシステムの適応性向上を実現した。
  • イベント駆動型通知により、クライアントはポーリングを伴わず状態変化のリアルタイム更新を受信でき、応答性が向上し、オーバーヘッドが削減された。
  • 組み込みの SNMP サポートおよびネットワーク性能監視アルゴリズムにより、ネットワーク遅延およびスループットに対する正確なエンドツーエンド可視性が得られた。
  • フレームワークは複数の監視ツールおよびプロシージャを効果的に統合し、計算ノード、アプリケーション、インfra構造の統合監視を可能にした。
  • MonALISA は VRVS システムのリフレクター間接続の監視および最適化に使用されており、複雑なネットワークトポロジーにおいてもその有効性が検証された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。