Skip to main content
QUICK REVIEW

[论文解读] Estimating the fractal dimension: a comparative review and open source implementations

Georoge Datseris, Inga Kottlarz|arXiv (Cornell University)|Sep 13, 2021
Chaos control and synchronization参考文献 8被引用 2
一句话总结

本文对十种分形维数估计算法——聚焦于基于相关性的方法与基于熵的方法——进行了全面的定量比较,使用了合成数据和真实实验数据。研究发现,在合成数据中,基于相关性的估计算法优于基于熵的方法;而在真实数据中,情况则相反,当已知动力学方程时,李雅普诺夫维数最为准确。所有方法均已通过DynamicalSystems.jl以开源代码形式实现。

ABSTRACT

The fractal dimension of state space sets is typically estimated via the scaling of either the generalized (Renyi) entropy or the correlation sum versus a size parameter. Motivated by the lack of quantitative and systematic comparisons of fractal dimension estimators in the literature, and also by new and improved methods for delay embedding, in this paper we provide a detailed and quantitative comparison for estimating the fractal dimension. We start with summarizing existing estimators and then perform an evaluation of these estimators, comparing their performance and precision using different data sets and taking into account the impact of features like length, noise, embedding dimension, non-stationarity, among many others. After comparing ten estimators, we conclude that for synthetic data the correlation based estimator is much better than the entropy one, while for real experimental data it seems to be the other way around. All other estimators perform worse. If the dynamic equations are known analytically, the Lyapunov dimension is always the most accurate. We furthermore discuss common pitfalls, like calculating the dimension of inappropriate data, automated ways to estimate the dimension, and provide an outlook of possible future research. All quantities discussed are implemented as performant and easy to use open source code via the software DynamicalSystems.jl.

研究动机与目标

  • 系统比较十种现有分形维数估计算法在不同数据条件下的性能与精度。
  • 评估数据特征(如长度、噪声、嵌入维数和非平稳性)对估计算法准确性的影响。
  • 识别适用于合成数据与真实实验数据的最可靠估计算法,并评估已知动力学方程的作用。
  • 为支持可重复研究,提供所有估计算法的开源、高性能实现。
  • 指出分形维数估计中的常见陷阱,并为未来的方法改进提供建议。

提出的方法

  • 本研究基于广义Rényi熵与相关和缩放关于大小参数的性质,评估了十种分形维数估计算法。
  • 在多样化的数据集上测试估计算法,包括已知动力学的混沌系统和真实实验时间序列,控制变化数据长度、噪声和嵌入维数。
  • 通过偏差、方差和收敛速度等指标,在多次试验中对性能进行定量评估。
  • 分析包括自动估计算法过程,并评估对非平稳性和有限数据效应的鲁棒性。
  • 所有估计算法均已实现在开源软件DynamicalSystems.jl中,以支持可重复研究和社区使用。
  • 当已知动力学方程时,通过解析方法计算李雅普诺夫维数,作为黄金标准基准。

实验结果

研究问题

  • RQ1在具有已知动力学的合成数据中,哪种分形维数估计算法表现最佳?
  • RQ2噪声、数据长度和嵌入维数如何影响不同估计算法的准确性?
  • RQ3基于熵的方法与基于相关性的方法在合成数据与真实实验数据中的表现是否存在差异?
  • RQ4当已知解析李雅普诺夫维数时,数值估计算法的准确性如何?
  • RQ5分形维数估计中最常见的陷阱是什么,如何避免?

主要发现

  • 在合成数据中,基于相关性的估计算法在精度和收敛性方面始终优于基于熵的估计算法。
  • 在真实实验数据中,基于熵的估计算法表现优于基于相关性的方法,这可能是由于噪声和有限采样效应所致。
  • 当已知动力学方程时,李雅普诺夫维数能提供最准确的分形维数估计。
  • 在各自的数据环境中,其他所有测试的估计算法表现均不如表现最佳的方法。
  • 常见陷阱包括在非混沌或非平稳数据上估计维数,以及将估计算法错误地应用于短时序或噪声较大的时间序列。
  • 通过DynamicalSystems.jl提供的开源实现,使研究人员能够高效、可重复且便捷地进行分形维数估计。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。