Skip to main content
QUICK REVIEW

[論文レビュー] Quasi-Linear-Time Algorithm for Longest Common Circular Factor

Mai Alzamel, Maxime Crochemore|arXiv (Cornell University)|Jan 1, 2019
Algorithms and Data Compression参考文献 28被引用数 2
ひとこと要約

本稿では、Longest Common Circular Factor (LCCF) 問題に対する最初の準線形時間アルゴリズムを提示する。時間計算量は O(n log⁵ n)、空間計算量は O(n log² n) である。この手法は、後継配列、同期化フラグメント、Lyndon分解、幾何的手法を組み合わせ、問題を互換性を持つ4次元長方形の交差に還元することで、S の最長の因子(その巡回シフトが T に出現するもの)を効率的に計算可能にする。

ABSTRACT

We introduce the Longest Common Circular Factor (LCCF) problem in which, given strings $S$ and $T$ of length $n$, we are to compute the longest factor of $S$ whose cyclic shift occurs as a factor of $T$. It is a new similarity measure, an extension of the classic Longest Common Factor. We show how to solve the LCCF problem in $O(n \log^5 n)$ time.

研究の動機と目的

  • 古典的な Longest Common Factor (LCF) 問題を拡張した、新しい文字列類似度測度である Longest Common Circular Factor (LCCF) 問題を導入し、その解法を提示すること。
  • S の因子のうち、その巡回シフトが T に部分文字列として出現するものの最長長さを計算する効率的アルゴリズムを開発すること。
  • 2次時間計算量を著しく下回る、準線形時間性能を達成すること。これは、巡回的因子照合の非自明性にもかかわらず実現可能である。
  • LCCF 問題が、互換性制約を伴う4次元長方形の交差問題に還元可能であることを示すこと。

提案手法

  • アルゴリズムは、後継配列と重み付き祖先クエリを用いて、フラグメントの出現位置を効率的に特定し、一致する因子の区間を計算する。
  • τ-同期化関数を用いて非周期的フラグメントを同定し、Lyndon分解を用いて高周期的ケースを処理する。
  • 問題は、S と T の連続する2つのフラグメントの位置的制約を符号化する各長方形の交差をチェックする問題に還元される。
  • 重みはフラグメント長に基づく4次元長方形の最大重み交差問題を、スイープラインアルゴリズムで解く。
  • 部分文字列の出現が後継配列上で区間を形成することを活用し、範囲ベースの属性チェックを可能にする。
  • 内部パターンマッチングと幾何最適化を統合することで、最終的な時間計算量を達成する。

実験結果

リサーチクエスチョン

  • RQ1LCCF 問題は、古典的 LCF 問題の拡張であるにもかかわらず、2次時間未満で解けるか?
  • RQ2S の因子のうち、その巡回シフトが T に部分文字列として出現するものの最長長さを計算する最適時間計算量は何か?
  • RQ3巡回的性質を持つ因子照合を、文字列データ構造を用いて効率的に符号化・照合する方法は何か?
  • RQ4複数の制約を伴う内部文字列パターンマッチング問題に、幾何的手法を効果的に適用できるか?

主な発見

  • LCCF 問題は O(n log⁵ n) 時間および O(n log² n) 空間で解けることが保証され、ナイーブなアプローチに比べて顕著な改善が達成された。
  • このアルゴリズムは、O(m log³ m) 時間で解ける「互換性を持つ長方形の最大重み交差問題」への還元によって、その効率性を達成している。
  • 同期化フラグメントの使用により、S と T の一致するフラグメントが一貫して整合的にアラインされるため、正しい幾何的符号化が可能になる。
  • Lyndon分解と同期化関数に基づく別々の戦略を用いることで、非周期的および高周期的ケースの両方を効果的に処理できる。
  • この解法は、タイプ-(a,b) 成分に分解することで、すべてのタイプの巡回的因子をカバーする柔軟性と一般性を持つ。
  • 本アルゴリズムは、LCCF 問題に対して準線形時間計算量を達成する最初のものであり、線形時間解法の可能性が残されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。