Skip to main content
QUICK REVIEW

[論文レビュー] Fractional Repetition Codes for Repair in Distributed Storage Systems

Salim El Rouayheb, Kannan Ramchandran|arXiv (Cornell University)|Oct 13, 2010
Advanced Data Storage Technologies参考文献 16被引用数 42
ひとこと要約

本稿は、分散ストレージにおける低複雑性で非コード化された修復を可能にする新しいクラスの正確な最小帯域幅レジレント(MBR)コードとして、分数反復(FR)コードを導入する。このコードは、データパケットをノード間で複数コピーして保存することで実現される。構成は、外側のMDSコードと、正則グラフおよびスティーナー系に基づく内側のFRコードを組み合わせており、テーブルベースの修復モデル下で最適なストレージ容量を達成するとともに、新たなFR容量の概念を確立し、その上界を導出する。

ABSTRACT

We introduce a new class of exact Minimum-Bandwidth Regenerating (MBR) codes for distributed storage systems, characterized by a low-complexity uncoded repair process that can tolerate multiple node failures. These codes consist of the concatenation of two components: an outer MDS code followed by an inner repetition code. We refer to the inner code as a Fractional Repetition code since it consists of splitting the data of each node into several packets and storing multiple replicas of each on different nodes in the system. Our model for repair is table-based, and thus, differs from the random access model adopted in the literature. We present constructions of Fractional Repetition codes based on regular graphs and Steiner systems for a large set of system parameters. The resulting codes are guaranteed to achieve the storage capacity for random access repair. The considered model motivates a new definition of capacity for distributed storage systems, that we call Fractional Repetition capacity. We provide upper bounds on this capacity while a precise expression remains an open problem.

研究の動機と目的

  • 分散ストレージシステムにおける低複雑性で非コード化された修復を維持しつつ、正確なMBRコードを設計すること。
  • 複数のノード障害が発生する状況下でも高い信頼性と低帯域幅修復を維持する課題に対処すること。
  • テーブルベースの修復モデル下で、新たなストレージ容量指標「分数反復(FR)容量」を提案すること。
  • 正則グラフおよびスティーナー系に基づくFRコードを構築し、最適または近似最適なストレージ容量を達成すること。
  • FR容量の上界を導出し、このようなコードの理論的限界を理解すること。

提案手法

  • 2段階の符号構成を採用:外側のMDS符号により、任意のkノードからのファイル復元が保証され、内側のFR符号により、データのレプリケーションによる非コード化修復が可能となる。
  • 各ノードはd個のデータパケットを格納し、各パケットは異なるノードにρ回レプリケートされ、分数反復パターンを形成する。
  • ρ=2(1回の障害)の場合、FRコードは正則グラフを用いて構築され、各パケットが正確に2回格納されることを保証する。
  • ρ>2(複数回の障害)の場合、スティーナー系などの組合せ設計を用いて、十分な冗長性と修復耐性を確保する。
  • テーブルベースの修復モデルを採用し、代替ノードが計算を伴わずにd個の生存ノードから事前に指定されたパケットをダウンロードする。
  • FR容量は、FR符号の制約下で格納可能なパケット数の最大値として定義され、平均化および再帰的解析を用いて上界が導出される。

実験結果

リサーチクエスチョン

  • RQ1テーブルベースの修復モデル下で、最適なストレージ容量を維持しつつ、非コード化修復を実現する正確なMBRコードを構築可能か?
  • RQ2正則グラフおよびスティーナー系に基づくFRコードは、複数回の障害を想定した分散ストレージシステムにおいて、理論的ストレージ容量に達するか?
  • RQ3分数反復(FR)容量の上界は何か? また、実用的なシステムパrameterに対して、その上界はどの程度タイトか?
  • RQ4現在のグラフおよびスティーナー系に基づく構成を超えて、すべての可能な(n,k,d)パラメータに対してFRコードを構築可能か?
  • RQ5FR容量に対して一般式が存在するか、それとも特定の構成および上界に限定されるか?

主な発見

  • 正則グラフに基づくFRコードは、すべての可能なシステムパラメータにおいて、単一ノード障害(ρ=2)の状況で最適なストレージ容量を達成する。
  • スティーナー系を用いて構築されたFRコードは、最大ρ−1回の障害に対し非コード化修復をサポートし、ランダムアクセス修復モデル下で最適または近似最適なストレージ容量を達成する。
  • 提案されたテーブルベースの修復モデルにより、FR符号の制約下で格納可能なパケット数の最大値として定義される新たな容量指標「FR容量」が導入された。
  • 平均化論法を用いてFR容量の上界が導出され、(n,k,d)=(7,3,3)の場合、達成可能な最大容量が6以下であることが示され、この上界はタイトである。
  • よりタイトな再帰的上界が提案され、nおよびkが大きい場合に平均化上界を上回る性能を示すが、真の容量との差を埋めるのは未解決の問題のままである。
  • 本稿は、ランダムアクセス修復下でFRコードがMBR点に達することを確立し、適切な符号設計と組み合わせることで、非コード化修復が最適性を損なわないことを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。