[論文レビュー] On the Hardness and Inapproximability of Recognizing Wheeler Graphs
この論文は、Wheelerグラフの認識の計算的非決定的困難性を確立し、σ ≥ 2 のエッジラベルアルファベットに対して、認識問題がNP完全であることを証明している。さらに、最適化バージョンであるWheelerグラフ違反(WGV)とWheeler部分グラフ(WS)はそれぞれAPX-hardおよびAPXに属することを示しており、効率的な近似の根本的な限界を示している。本研究では、グラフ同型性に依存する指数時間の正確なアルゴリズムを提供し、多項式時間で解ける部分クラスを同定しており、可解性における構造的パラメータの役割を強調している。
In recent years several compressed indexes based on variants of the Burrows-Wheeler transformation have been introduced. Some of these are used to index structures far more complex than a single string, as was originally done with the FM-index [Ferragina and Manzini, J. ACM 2005]. As such, there has been an increasing effort to better understand under which conditions such an indexing scheme is possible. This has led to the introduction of Wheeler graphs [Gagie et al., Theor. Comput. Sci., 2017]. Gagie et al. showed that de Bruijn graphs, generalized compressed suffix arrays, and several other BWT related structures can be represented as Wheeler graphs, and that Wheeler graphs can be indexed in a way which is space efficient. Hence, being able to recognize whether a given graph is a Wheeler graph, or being able to approximate a given graph by a Wheeler graph, could have numerous applications in indexing. Here we resolve the open question of whether there exists an efficient algorithm for recognizing if a given graph is a Wheeler graph. We present: - The problem of recognizing whether a given graph G=(V,E) is a Wheeler graph is NP-complete for any edge label alphabet of size sigma >= 2, even when G is a DAG. This holds even on a restricted, subset of graphs called d-NFA’s for d >= 5. This is in contrast to recent results demonstrating the problem can be solved in polynomial time for d-NFA’s where d <= 2. We also show the recognition problem can be solved in linear time for sigma =1; - There exists an 2^{e log sigma + O(n + e)} time exact algorithm where n = |V| and e = |E|. This algorithm relies on graph isomorphism being computable in strictly sub-exponential time; - We define an optimization variant of the problem called Wheeler Graph Violation, abbreviated WGV, where the aim is to remove the minimum number of edges in order to obtain a Wheeler graph. We show WGV is APX-hard, even when G is a DAG, implying there exists a constant C >= 1 for which there is no C-approximation algorithm (unless P = NP). Also, conditioned on the Unique Games Conjecture, for all C >= 1, it is NP-hard to find a C-approximation; - We define the Wheeler Subgraph problem, abbreviated WS, where the aim is to find the largest subgraph which is a Wheeler Graph (the dual of the WGV). In contrast to WGV, we prove that the WS problem is in APX for sigma=O(1); The above findings suggest that most problems under this theme are computationally difficult. However, we identify a class of graphs for which the recognition problem is polynomial time solvable, raising the open question of which parameters determine this problem’s difficulty.
研究の動機と目的
- 与えられた有向エッジラベル付きグラフが Wheeler グラフであるかどうかを識別する計算複雑性を特定すること。
- 最適化バージョンの近似可能性を分析する:Wheeler グラフを得るために削除するエッジ数を最小化する問題(WGV)と、Wheeler 部分グラフを最大化する問題(WS)。
- Wheeler グラフの多項式時間認識を可能にする構造的パラメータを同定すること。
- グラフ同型性を用いた、認識および最適化問題の正確な指数時間アルゴリズムの開発。
提案手法
- FAS(Feedback Arc Set)問題からの還元を用いて、Wheeler グラフ認識のNP完全性を証明する。FASのインスタンスから、Wheeler公理を満たすエッジラベルと頂点順序が存在するかどうかが、FASインスタンスが充足可能であることと同値となるグラフを構築する。
- FASからの還元により、WGV が APX-hard であることを示し、P = NP でない限り、定数倍近似が存在しないことを示す。さらに、Unique Games 猜定のもとでは、任意の C ≥ 1 に対して C-近似を見つけることもNP困難である。
- σ が定数のとき、WS が APX に属することを証明する。そのために、ソースとルート付き木(arborescences)の分岐と平面的レベル分けに基づく線形時間 Ω(1/σ)-近似アルゴリズムを構築する。
- すべての可能な Wheeler グラフ符号化(n, e, σ が同一)を列挙し、入力グラフとの同型性をチェックすることで、認識、WGV、WS のための指数時間正確アルゴリズムを開発する。
- Wheeler グラフの空間効率の良い符号化が、探索空間を制限することを活用し、グラフ同型性が部分指数時間で解ける場合、同型性チェックの計算量を部分指数時間に保てるようにする。
- キュー番号と Wheeler グラフの関係を用いて、σ = 1 の場合、線形時間で認識が可能であることを示す。
実験結果
リサーチクエスチョン
- RQ1σ ≥ 2 の場合、与えられたグラフが Wheeler グラフであるかどうかを識別する問題は、NP完全か?
- RQ2d ≥ 5 の d-NFA などの制限付きグラフクラスにおいて、Wheeler グラフ認識問題は多項式時間で解けるか?
- RQ3Wheeler グラフ違反(WGV)問題に対して定数倍近似アルゴリズムは存在するか?
- RQ4σ が定数のとき、Wheeler 部分グラフ(WS)問題は APX に属するか?
- RQ5Wheeler グラフ認識またはその最適化バージョンに対して、固定パrameter可解(FPT)アルゴリズムは存在するか?
主な発見
- Wheeler グラフの認識問題は、任意のエッジラベルアルファベットサイズ σ ≥ 2 に対してNP完全であり、入力グラフがDAGであっても同様である。
- Wheeler グラフを得るためにエッジを最小限に削除する最適化問題(WGV)はAPX-hardである。これは、P = NP でない限り、定数倍近似が存在しないことを示唆している。
- Unique Games 猜定のもとでは、任意の C ≥ 1 に対して WGV の C-近似を見つけることはNP困難である。
- 双対問題であるWS(最大のWheeler部分グラフの探索)は、σ が定数のときAPXに属する。線形時間の Ω(1/σ)-近似アルゴリズムが提供されている。
- σ = 1 の場合、Wheeler グラフ認識は線形時間で解ける。これは、エッジラベルの競合がないため、トポロジカル順序に帰着するからである。
- 認識、WGV、WS のための指数時間正確アルゴリズムは、2^{e log σ + O(n+e)} の時間で動作し、候補の符号化の妥当性を検証するためにグラフ同型性チェックに依存している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。