Skip to main content
QUICK REVIEW

[论文解读] New Lower Bounds for the Maximum Number of Runs in a String

Kazuhiko Kusano, Wataru Matsubara|ArXiv.org|Apr 8, 2008
Algorithms and Data Compression参考文献 11被引用 37
一句话总结

本文提出了字符串长度为 $n$ 时最大运行次数的新的下界 $α = 56733/60064 \approx 0.944542$,优于此前的下界 $3/(1+\sqrt{5}) \approx 0.927$。作者构造了一个特定的长度为 60,064 的字符串 $τ$,其中包含 56,714 个运行,并证明字符串 $τ^k$ 会产生 $56733k - 18$ 个运行,通过针对重复字符串中运行行为的简单而有效的分析,确立了改进的渐近下界。

ABSTRACT

We show a new lower bound for the maximum number of runs in a string. We prove that for any e > 0, (a -- e)n is an asymptotic lower bound, where a = 56733/60064 = 0.944542. It is superior to the previous bound 0.927 given by Franek et al. Moreover, our construction of the strings and the proof is much simpler than theirs.

研究动机与目标

  • 改进已知的字符串长度 $n$ 时最大运行次数的渐近下界。
  • 推翻长期以来认为 $3/(1+\sqrt{5}) \approx 0.927$ 是最优下界的猜想。
  • 与先前工作相比,提供一种更简单、更透明的构造与证明方法。
  • 证明每字符的最大运行次数可超过此前认为的理论极限。

提出的方法

  • 通过计算验证,构造一个长度为 60,064 的特定二进制字符串 $\tau$,其包含 56,714 个运行。
  • 证明对于 $k \geq 2$,$\tau^k$(即 $\tau$ 的 $k$ 个副本连接而成的字符串)的运行数为 $56733k - 18$。
  • 利用渐近比 $\rho(n)/n \to 56733/60064$ 当 $k \to \infty$ 时,推导出新的下界。
  • 利用重复字符串中运行数的增量增长趋于稳定这一事实,将 $\text{run}(\tau^3) - \text{run}(\tau^2)$ 作为关键的增长率参数。
  • 应用一个通用结果(定理 3.1):对于任意字符串 $w$,当 $n$ 足够大时,有 $\rho(n)/n > (\text{run}(w^3) - \text{run}(w^2))/|w| - \varepsilon$,从而推导出渐近下界。
  • 使用启发式计算机搜索发现高运行密度的字符串,包括 $\tau$,以实现高运行密度。

实验结果

研究问题

  • RQ1字符串长度为 $n$ 时,最大运行次数的真实渐近下界是什么?
  • RQ2此前推测的下界 $3/(1+\sqrt{5}) \approx 0.927$ 是否可以被超越?
  • RQ3是否存在一种更简单的构造与证明方法,以获得更高的运行次数下界?
  • RQ4能否通过分析重复字符串中的运行密度,得出更紧致的渐近下界?
  • RQ5是否存在运行密度超过 $0.944$ 的字符串,是否意味着此前的下界并非最优?

主要发现

  • 长度为 60,064 的字符串 $\tau$ 包含 56,714 个运行,运行密度约为 0.944226,已超过此前的下界 $3/(1+\sqrt{5}) \approx 0.927$。
  • 对于 $k \geq 2$,字符串 $\tau^k$ 恰好包含 $56733k - 18$ 个运行,确认了斜率为 $56733/60064 \approx 0.944542$ 的线性增长速率。
  • 对于任意 $\varepsilon > 0$ 且足够大的 $n$,渐近下界 $\rho(n) > (56733/60064 - \varepsilon)n$ 成立,从而确立 $\alpha = 56733/60064 \approx 0.944542$ 为有效下界。
  • 该证明显著简化了 Franěk 等人先前的构造,仅依赖基本的字符串重复与运行计数,无需复杂的周期性论证。
  • 长度为 1,558 的更短字符串 $\tau_{1558}$ 包含 1,445 个运行,同样得出约 $0.93645$ 的下界,证实了该方法的稳健性。
  • 该结果推翻了 2003 年提出的猜想,即 $3/(1+\sqrt{5}) \approx 0.927$ 是最优下界,重新开启了对更紧致下界的研究。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。