Skip to main content
QUICK REVIEW

[論文レビュー] Toward fits to scaling-like data, but with inflection points & generalized Lavalette function

Marcel Ausloos|arXiv (Cornell University)|Apr 11, 2014
Complex Systems and Time Series Analysis参考文献 24被引用数 7
ひとこと要約

本稿では、対数対数プロット上での変曲点や非線形なずれを示すスケーリング的データをモデル化するため、最大7つの自由パラメータを有する一般化されたラバレット関数を提案する。2つの基本的ラバレット法則を組み合わせることで、半対数プロット上でのシグモイド的形状を達成し、標準的なべき乗則やZipf-Pareto-Mandelbrotモデルを超えて、特にランク・サイズ分布における実験的データの適合性を向上させる。

ABSTRACT

Experimental and empirical data are often analyzed on log-log plots in order to find some scaling argument for the observed/examined phenomenon at hands, in particular for rank-size rule research, but also in critical phenomena in thermodynamics, and in fractal geometry. The fit to a straight line on such plots is not always satisfactory. Deviations occur at low, intermediate and high regimes along the log($x$)-axis. Several improvements of the mere power law fit are discussed, in particular through a Mandelbrot trick at low rank and a Lavalette power law cut-off at high rank. In so doing, the number of free parameters increases. Their meaning is discussed, up to the 5 parameter free super-generalized Lavalette law and the 7-parameter free hyper-generalized Lavalette law. It is emphasized that the interest of the basic 2-parameter free Lavalette law and the subsequent generalizations resides in its "noid" (or sigmoid, depending on the sign of the exponents) form on a semi-log plot; something incapable to be found in other empirical law, like the Zipf-Pareto-Mandelbrot law. It remained for completeness to invent a simple law showing an inflection point on a \underline{log-log plot}. Such a law can result from a transformation of the Lavalette law through $x$ $ ightarrow$ log($x$), but this meaning is theoretically unclear. However, a simple linear combination of two basic Lavalette law is shown to provide the requested feature. Generalizations taking into account two super-generalized or hyper-generalized Lavalette laws are suggested, but need to be fully considered at fit time on appropriate data.

研究の動機と目的

  • 対数対数プロット上での標準的べき乗則フィットの限界に対処すること。これは、経験的データに凸/凹の形状、ギャップ、ショルダーが存在する場合にしばしば失敗する。
  • 対数対数プロット上での変曲点を捉えることが可能な一般化ラバレット関数の導入。これは、Zipf-Pareto-Mandelbrotのような古典的モデルに欠落している特徴である。
  • 2パラメータの基本的ラバレット法則を、より一般化された(5パラメータ)および超一般化された(7パラメータ)形に拡張し、複雑なデータへの適合性を高める。
  • 都市の人口分布やイタリアの都市名における聖人名の頻度といった、実世界現象のモデル化における一般化ラバレット関数の有効性を示すこと。
  • 2つの基本的ラバレット関数の線形結合が、対数対数スケール上での所望の変曲点を生成できることを示し、対数変換版の理論的曖昧性を克服すること。

提案手法

  • 変更されたラバレット関数 y(r) = κ (N r / (N − r + 1))⁻χ を使用。これは、高いランクで自然なカットオフを示すべき乗則の減衰を示す。
  • x → log(x) の変換を導入して変曲点を探索するが、理論的根拠が不明瞭であると主張し、代替的手法を採用する。
  • 2つの基本的ラバレット関数の線形結合を提案し、明確に定義された変曲点を持つ対数対数プロットを生成する。
  • 高次一般化を展開:5パラメータのスーパー一般化ラバレット法則および7パラメータのハイパーガラニゼーションラバレット法則をそれぞれ開発。両者とも、より高い適合能力を備える。
  • 一般化モデルを経験的データに非線形適合させるために、Levenberg–Marquardtアルゴリズムを採用。
  • 実データセット(イタリアの都市人口および都市名における聖人名の頻度)を用いて、対数対数プロットおよび半対数プロットの両方でモデルを検証。

実験結果

リサーチクエスチョン

  • RQ12つ以上のパラメータを有する一般化ラバレット関数は、単純なべき乗則から逸脱するスケーリング的データの適合性を、対数対数プロット上で向上させ得るか?
  • RQ2対数対数プロット上での変曲点の理論的・実用的意義は何か? そして、それはどのように体系的にモデル化可能か?
  • RQ32つの基本的ラバレット関数の線形結合が、どのようにして対数対数スケール上での変曲点を持つ関数を生成するのか?
  • RQ4スーパー一般化(5パラメータ)およびハイパーガラニゼーション(7パラメータ)ラバレット法則は、経験的ランク・サイズまたは分布データの記述をどの程度向上させるか?
  • RQ5なぜラバレット関数の半対数プロット形態が、シグモイド的またはノイド(N字型)行動の特定に特に有用なのか? これは標準的経験則とはどのように異なるのか?

主な発見

  • 2パラメータの基本的ラバレット関数は、r = N/2 における変曲点のおかげで、半対数プロット上にシグモイド的またはノイド的形状を示す。これは、Zipf-Pareto-Mandelbrot法則には欠落している特徴である。
  • 2つの基本的ラバレット関数の線形結合は、対数対数プロット上での明確な変曲点を持つ関数を成功裏に生成し、重要な理論的ギャップを埋めることに成功した。
  • 5パラメータのスーパー一般化ラバレット法則および7パラメータのハイパーガラニゼーションラバレット法則は、低域、中域、高域の各領域におけるデータ適合性を高める柔軟性を提供する。
  • イタリアの都市人口データへの適合では、一般化ラバレットモデルが上位6都市以降の低下をよりよく捉えており、単一べき乗則フィットに比べR²値が向上している。
  • イタリアの都市における聖人名頻度の累積分布関数(CDF)は、高ランクで顕著なカットオフを示すが、これは標準的なZipf-Mandelbrot形式に比べ、一般化ラバレット関数によってよりよくモデル化される。
  • CDFの半対数プロットでは、ラバレットに基づく適合が明確なシグモイド的またはノイド的形状を示しており、標準モデルが欠落させる中間領域の行動をモデルが捉えられることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。