Skip to main content
QUICK REVIEW

[論文レビュー] ElasTraS: An Elastic Transactional Data Store in the Cloud

Sudipto Das, Divyakant Agrawal|arXiv (Cornell University)|Aug 23, 2010
Distributed systems and fault tolerance参考文献 20被引用数 163
ひとこと要約

ElasTraS は、クラウド環境向けに弾力的でトランザクション対応のデータストアを提案する。単一パーティション内でのスケーラビリティと ACID 合致性を達成するために、パーティショニングされたデータベース設計とクラウドの弾力性を組み合わせる。軽量なトランザクションマネージャーと動的パーティション再割り当てを用いて、スケーラブルで可串的(serializable)なトランザクションを実現するとともに、支払いに応じたクラウドインfraストラクチャにより低オーバーヘッドとコスト効率を維持する。

ABSTRACT

Over the last couple of years, "Cloud Computing" or "Elastic Computing" has emerged as a compelling and successful paradigm for internet scale computing. One of the major contributing factors to this success is the elasticity of resources. In spite of the elasticity provided by the infrastructure and the scalable design of the applications, the elephant (or the underlying database), which drives most of these web-based applications, is not very elastic and scalable, and hence limits scalability. In this paper, we propose ElasTraS which addresses this issue of scalability and elasticity of the data store in a cloud computing environment to leverage from the elastic nature of the underlying infrastructure, while providing scalable transactional data access. This paper aims at providing the design of a system in progress, highlighting the major design choices, analyzing the different guarantees provided by the system, and identifying several important challenges for the research community striving for computing in the cloud.

研究の動機と目的

  • 従来のデータベースがクラウド環境で直面するスケーラビリティのボトルネックを解消するため、データストア層における弾力性を提供すること。
  • クラウドインfraストラクチャにおける水平スケーリングをサポートしつつ、単一パーティション内で ACID トランザクションの保証を提供すること。
  • 動的パーティション再割り当てと自動回復を可能にすることで、高可用性とコスト効率を実現すること。
  • スケーラブルな NoSQL ストレージと従来のリレーショナルデータベースの間のギャップを埋め、最小限のパフォーマンスオーバーヘッドでトランザクションセマンティクスをサポートすること。
  • 主に単一オブジェクトや小さなデータセットにアクセスする現代のウェブワークロードを、軽量で弾力的なトランザクショナルモデルで効率的に処理できること。

提案手法

  • ElasTraS は、トランザクション処理と並行制御を担当するオン・トランザクションマネージャー(OTM)が管理する論理的パーティションにデータをパーティショニングする。
  • 読み取り専用トランザクションは、ステートレスで、負荷に応じて容易に起動または削除可能な読み取り専用トランザクションマネージャー(HTM)が管理する。
  • メタデータマネージャーを用いてパーティションから OTM へのマッピングとリースを追跡し、動的ロードバランシングとフェイルオーバーを可能にする。
  • ログベースの回復を採用:OTM は耐久性を確保するため、Elastic Block Store(EBS)にログを出力する。障害発生後、ログから状態を再構築可能である。
  • ランタイム負荷に応じて OTM および HTM インスタンスを動的に起動・削除することで弾力性を実現し、自動的なパーティション再割り当てとメタデータの更新を伴う。
  • 一貫性とパフォーマンスのバランスを図るために、実証済みのデータベース技術(例:並行制御、回復)とスケーラブルなシステム設計原理(例:Bigtable スタイルのパーティショニング)を活用する。

実験結果

リサーチクエスチョン

  • RQ1クラウドベースのデータストアは、どのようにして弾力性と強力な ACID トランザクション保証を両立できるか?
  • RQ2進行中のトランザクションに影響を与えずに、動的パーティション再割り当てを可能にするアーキテクチャパターンは何か?
  • RQ3軽量でステートレスなトランザクションマネージャーは、分散データストアにおけるスケーラビリティとフェイルセーフティをどのように向上させるか?
  • RQ4弾力的でパーティショニングされたトランザクショナルシステムにおいて、一貫性、可用性、パフォーマンスの間にはどのようなトレードオフがあるか?
  • RQ5パーティショニングされたデータベースとクラウドの弾力性を組み合わせたハイブリッドモデルは、アプリケーションの変更を最小限に抑えながら、実世界のウェブワークロードを効果的にサポートできるか?

主な発見

  • ElasTraS は、個々のデータパーティション内で可串的(serializable)かつ ACID 合致性のあるトランザクション処理を提供し、一貫性と耐久性を保証する。
  • システムは負荷に応じて OTM および HTM インスタンスを動的に起動・削除することで弾力性を実現し、利用率が低い際の運用コストを削減する。
  • 障害回復はログベースの状態再構築により実現され、OTM はインスタンス障害後に EBS に保存されたログから回復する。
  • HTM はステートレスであり、迅速にインスタンス化可能で、読み込み中心のワークロードを効率的に処理できる。
  • 設計は、ウェブアプリケーションで一般的な単一キーまたは単一パーティショントランザクションが主なワークロードを占める状況をサポートする。
  • 動的パーティション再割り当てにより、OTM 間での負荷分散が可能となり、変動するワークロード下でもシステムのスケーラビリティと応答性が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。