QUICK REVIEW

[論文レビュー] Lyndon words and short superstrings

Marcin Mucha|arXiv (Cornell University)|Jan 6, 2013

Algorithms and Data Compression参考文献 26被引用数 37

ひとこと要約

この論文は、最大非対称TSPパス問題に対する2/3-近似アルゴリズムと、サイクルカバーに基づく1/2-近似アプローチを組み合わせることで、最短スーパー文字列問題に対する2 11/23-近似アルゴリズムを提示する。主な革新点は、Lyndon語を用いて重なり構造理論を拡張し、文字列の重なりを精緻に分析することで、長年にわたり続く2.5-近似の壁を破ったことにある。

ABSTRACT

In the shortest superstring problem, we are given a set of strings {s1,...,sk} and want to find a string that contains all si as substrings and has minimum length. This is a classical problem in approximation and the best known approximation factor is 2 1/2, given by Sweedyk [19] in 1999. Since then no improvement has been made, howerever two other approaches yielding a 2 1/2-approximation algorithms have been proposed by Kaplan et al. [10] and recently by Paluch et al. [16] --- both based on a reduction to maximum asymmetric TSP path (Max-ATSP-Path) and structural results of Breslauer et al. [5].In this paper we give an algorithm that achieves an approximation ratio of 2 11/23, breaking through the longstanding bound of 2 1/2. We use the standard reduction of Shortest-Superstring to Max-ATSP-Path. The new, somewhat surprising, algorithmic idea is to take the better of the two solutions obtained by using: (a) the currently best 2/3-approximation algorithm for Max-ATSP-Path and (b) a naive cycle-cover based 1/2-approximation algorithm. To prove that this indeed results in an improvement, we further develop a theory of string overlaps, extending the results of Breslauer et al. [5]. This theory is based on the novel use of Lyndon words, as a substitute for generic unbordered rotations and critical factorizations, as used by Breslauer et al.

研究の動機と目的

最短スーパー文字列問題における長年の2.5-近似の壁を打ち破ること。
未境界回転と臨界因子分解の代わりにLyndon語を用いることで、文字列の重なりに関する新しい理論的枠組みを構築すること。
最大ATSPパス問題に対する2/3-近似アルゴリズムと、サイクルカバーを用いた1/2-近似アルゴリズムを組み合わせることで、近似比を向上させること。
Breslauerら[5]の構造的結果を、Lyndon語に基づく文字列の重なり分析を用いて拡張すること。

提案手法

最短スーパー文字列問題を最大非対称TSPパス問題（Max-ATSP-Path）に還元する。
現在知られている最高の2/3-近似アルゴリズムをMax-ATSP-Pathに適用する。
第二の候補解として、単純なサイクルカバーに基づく1/2-近似アルゴリズムを用いる。
2/3-近似と1/2-近似の両方の解のうち、より良い方を選んでスーパー文字列を構築する。
2つの解路を分析・比較するため、Lyndon語に基づく文字列の重なり理論を新たに構築する。
Breslauerら[5]の一般的な未境界回転と臨界因子分解の代わりに、Lyndon語に基づく因子分解を導入し、よりきめ細やかな構造的分析を可能にする。

実験結果

リサーチクエスチョン

RQ1新しいアルゴリズム的組み合わせによって、最短スーパー文字列問題の2.5-近似の境界を上回ることは可能か？
RQ2Lyndon語をどのように活用すれば、スーパー文字列構築における文字列の重なり分析を洗練させられるか？
RQ3臨界因子分解の代わりにLyndon語因子分解を用いた場合、重なりの構造的性質はどのように変化するか？
RQ42/3-近似と1/2-近似を組み合わせることで、単独で用いる場合よりも優れた全体の近似比が得られるか？
RQ5Breslauerら[5]の理論的枠組みは、Lyndon語に基づく手法を用いて拡張・改善可能か？

主な発見

本論文は、最短スーパー文字列問題に対して2 11/23の新しい近似比を達成し、長年の2.5の境界を上回った。
この改善は、Max-ATSP-Pathに対する2/3-近似解と、サイクルカバーに基づく1/2-近似解のうち、より良い方の解を選択することで達成された。
Lyndon語が、Breslauerら[5]の重なり構造理論を再導出し・拡張する基盤として用いられ、未境界回転と臨界因子分解の代わりに採用された。
Lyndon語の使用により、より洗練された文字列の重なり分析が可能となり、改善された近似比を証明する上で不可欠であった。
開発された理論的枠組みにより、Lyndon語の組合せ的性質を文字列の重なりに活用することで、スーパー文字列長に対するよりきつい上限が得られた。
本結果は、近似アルゴリズムと高度な文字列組合せ論を組み合わせることで、根本的な文字列問題において顕著な改善が達成可能であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。