Skip to main content
QUICK REVIEW

[論文レビュー] On the number of squares in a finite word

Srečko Brlek, Shuo Li|arXiv (Cornell University)|Apr 21, 2022
semigroups and automata theory被引用数 4
ひとこと要約

この論文は、有限語 $ w $ における異なる空でない平方因子の数が $ |w| - |\text{Alph}(w)| + 1 $ で抑えられることを証明し、長年の予想であるFraenkel-Simpson予想を裏付ける。著者らはRauzyグラフと小サイクルを用いて、平方因子からこれらのサイクルへの単射写像を構成し、語における共役性と周期性の組み合わせ的性質を活用する。

ABSTRACT

A fundamental concept related to strings is that of repetitions. It has been extensively studied in many versions, from both purely combinatorial and algorithmic angles. One of the most basic questions is how many distinct squares, i.e., distinct strings of the form UU, a string of length n can contain as fragments. It turns out that this is always 𝒪(n), and the bound cannot be improved to sublinear in n [Fraenkel and Simpson, JCTA 1998]. Several similar questions about repetitions in strings have been considered, and by now we seem to have a good understanding of their repetitive structure. For higher-dimensional strings, the basic concept of periodicity has been successfully extended and applied to design efficient algorithms - it is inherently more complex than for regular strings. Extending the notion of repetitions and understanding the repetitive structure of higher-dimensional strings is however far from complete. Quartics were introduced by Apostolico and Brimkov [TCS 2000] as analogues of squares in two dimensions. Charalampopoulos, Radoszewski, Rytter, Waleń, and Zuba [ESA 2020] proved that the number of distinct quartics in an n×n 2D string is 𝒪(n²log²n) and that they can be computed in 𝒪(n²log²n) time. Gawrychowski, Ghazawi, and Landau [SPIRE 2021] constructed an infinite family of n×n 2D strings with Ω(n²log n) distinct quartics. This brings the challenge of determining asymptotically tight bounds. Here, we settle both the combinatorial and the algorithmic aspects of this question: the number of distinct quartics in an n×n 2D string is 𝒪(n²log n) and they can be computed in the worst-case optimal 𝒪(n²log n) time. As expected, our solution heavily exploits the periodic structure implied by occurrences of quartics. However, the two-dimensional nature of the problem introduces some technical challenges. Somewhat surprisingly, we overcome the final challenge for the combinatorial bound using a result of Marcus and Tardos [JCTA 2004] for permutation avoidance on matrices.

研究の動機と目的

  • 1998年のFraenkelとSimpsonの予想を解決すること。すなわち、有限語における異なる空でない平方因子の数が、その長さ以下であるということ。
  • 従来の $ \frac{3}{2}|w| $ や $ \frac{11}{6}|w| $ といった境界よりもタイトな平方複雑性の上界を確立すること。
  • Rauzyグラフと小サイクルを用いた構造的枠組みを構築し、有限語における平方因子を分析すること。
  • 異なる平方因子の数が、語の長さだけでなく、アルファベットのサイズによっても本質的に制約されることを示すこと。

提案手法

  • 各 $ n \leq |w| $ に対して、Rauzyグラフ $ \Gamma_n(w) $ を構築する。ここで頂点は $ w $ の長さ $ n $ の因子であり、辺は重なりを表す。
  • Rauzyグラフにおける「小サイクル」を定義する。これは、$ u $ が原始的語であるときの形 $ uu $ の繰り返しパターンに対応する閉路である。
  • 根語の共役類に基づいて平方因子をクラスに分類し、クラスの「インデックス」を、根語のべきが因子として現れる最大回数として定義する。
  • 共役性と周期性の性質を活用して、各異なる平方因子から、Rauzyグラフの和集合内の一意な小サイクルへの単射写像を確立する。
  • Rauzyグラフの和集合のサイクル数(cyclomatic number)を用いて、小サイクルの総数を上界づけ、これが異なる平方因子の数の上界を示す。
  • FineとWilfの補題およびLyndon-Sch"utzenbergerの結果を用いて周期的構造を分析し、写像の単射性を保証する。

実験結果

リサーチクエスチョン

  • RQ1有限語における異なる空でない平方因子の数は、その長さよりもタイトに抑えられるか?
  • RQ2Fraenkel-Simpson予想(異なる平方因子の数は最大 $ |w| $ である)は正しいか? さらにアルファベットサイズを含めた形に強化可能か?
  • RQ3Rauzyグラフと小サイクルの構造を用いて、平方因子をグラフの特徴へ一意に写像でき、その結果として数え上げが可能になるか?
  • RQ4語に含まれる異なる文字の数は、それが含み得る異なる平方因子の最大数にどのように影響するか?
  • RQ5根語の共役類と、その平方が因子として現れる回数の間には、正確にどのような関係があるか?

主な発見

  • 有限語 $ w $ における異なる空でない平方因子の数 $ S(w) $ は、$ S(w) \leq |w| - |\text{Alph}(w)| + 1 $ を満たし、これにより予想が証明された。
  • 従来の結果(例:$ \frac{3}{2}|w| $)よりも厳密な境界であり、アルファベットサイズを重要なパラメータとして組み込んでいる。
  • 異なる空でない平方因子の集合から、$ w $ のRauzyグラフの和集合内の小サイクルの集合への単射写像が構成され、これにより境界が証明された。
  • すべてのRauzyグラフにわたる小サイクルの総数は $ |w| - |\text{Alph}(w)| $ で抑えられ、これが異なる平方因子の数を直接制限する。
  • アルファベットが小さい語では、境界が著しくタイトになる。例えば、一文字語では、唯一の平方因子しか存在しない。
  • 証明は共役類と周期性の構造的性質に依存しており、小サイクル内の一意な辺列により写像の単射性が保証されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。