Skip to main content
QUICK REVIEW

[論文レビュー] Differences between Independent Variables and Almost Benford Behavior

Steven J. Miller, Mark J. Nigrini|arXiv (Cornell University)|Jan 13, 2006
Benford’s Law and Fraud Detection被引用数 2
ひとこと要約

本稿は、独立同一分布に従う確率変数の順序統計量の差の桁の分布を調査し、弱い条件下でもこれらの差が、サンプルサイズとサポートスケールによって定まるシフトを伴う指数分布に収束することを示している。これはベンフォードの法則に近く、ポアソン和分および対数分布のモジュロ1におけるフーリエ解析を用いて、ベンフォードの法則からの逸脱を明示的かつ高速に収束する式で導出する。

ABSTRACT

Fix a base B and let zeta have the standard exponential distribution; the distribution of digits of zeta base B is known to be very close to Benford's Law. If there exists a C such that the distribution of digits of C times the elements of some set is the same as that of zeta, we say that set exhibits shifted exponential behavior base B (with a shift of log_B C \bmod 1). Let X_1, >..., X_N be independent identically distributed random variables. If the X_i's are drawn from the uniform distribution on [0,L], then as N o\infty the distribution of the digits of the differences between adjacent order statistics converges to shifted exponential behavior (with a shift of \log_B L/N \bmod 1). By differentiating the cumulative distribution function of the logarithms modulo 1, applying Poisson Summation and then integrating the resulting expression, we derive rapidly converging explicit formulas measuring the deviations from Benford's Law. Fix a delta in (0,1) and choose N independent random variables from any compactly supported distribution with uniformly bounded first and second derivatives and a second order Taylor series expansion at each point. The distribution of digits of any N^\delta consecutive differences \emph{and} all N-1 normalized differences of the order statistics exhibit shifted exponential behavior. We derive conditions on the probability density which determine whether or not the distribution of the digits of all the un-normalized differences converges to Benford's Law, shifted exponential behavior, or oscillates between the two, and show that the Pareto distribution leads to oscillating behavior.

研究の動機と目的

  • コンパクトにサポートされた分布から抽出された独立同一分布に従う確率変数の隣接する順序統計量の差の桁の分布を理解すること。
  • これらの差がベンフォードの法則、シフト付き指数分布、あるいはそれらの間を振動する条件を特定すること。
  • 桁の分布がベンフォードの法則から逸脱する度合いを正確に測る、迅速に収束する公式を導出すること。
  • 元の確率密度関数の滑らかさと尾部挙動(特にパレート分布の場合)が、桁の分布の収束に与える影響を特定すること。

提案手法

  • 桁の分布をモデル化するため、差の対数の累積分布関数をモジュロ1で用いる。
  • ポアソン和分を用いて分布をフーリエ級数に変換し、ベンフォードの法則からの逸脱の精密な分析を可能にする。
  • 対数差の累積分布関数を微分し、得られた式を積分することで、明示的な誤差公式を導出する。
  • 収束の種類を特定するため、サンプルサイズNと分布パラメータの変化に対する導出式の挙動を分析する。
  • 収束がシフト付き指数分布に至ることを保証するため、確率密度関数に特に有界な一次および二次微分係数、および二次テイラー展開の条件を確立する。
  • 重い尾部を持つため、桁の分布がベンフォードの法則とシフト付き指数分布の間を振動する可能性があるパレート分布を、その性質を調査する。

実験結果

リサーチクエスチョン

  • RQ1独立同一分布に従うサンプルの順序統計量の差が、ベンフォードの法則またはシフト付き指数分布に収束する条件は何か?
  • RQ2ベンフォードの法則からの桁の分布の逸脱を、迅速に収束する公式で明示的に定量化することは可能か?
  • RQ3スケールパラメータLとサンプルサイズNは、桁の分布の指数分布のシフトにどのように寄与するか?
  • RQ4なぜパレート分布は、桁の分布が一様な極限に収束するのではなく、振動する挙動を示すのか?
  • RQ5元の密度関数の滑らかさと有界な微分係数は、桁の分布がシフト付き指数分布に収束するのをどのように影響するか?

主な発見

  • i.i.d. 一様分布 [0,L] の場合、隣接する順序統計量の差の桁の分布は、N → ∞ のとき、log_B(L/N) mod 1 のシフトを伴うシフト付き指数分布に収束する。
  • ポアソン和分と積分を用いて導出された明示的公式は、ベンフォードの法則からの逸脱を高速に収束する近似で提供する。
  • 有界な一次および二次微分係数、および二次テイラー展開を持つ任意のコンパクトにサポートされた分布に対して、N^δ 個の連続的および正規化された順序統計量の差は、シフト付き指数分布に従う。
  • 順序統計量の非正規化された差がベンフォードの法則に収束するのは、密度関数が特定の滑らかさと尾部条件を満たす場合に限る。それ以外の場合は、シフト付き指数分布に収束するか、振動する可能性がある。
  • パレート分布は、重い尾部のため、桁の分布がベンフォードの法則や固定されたシフト付き指数分布に収束せず、振動的になる。
  • シフト付き指数分布のシフトは、log_B C mod 1 で与えられ、ここでCはサポートとサンプルサイズに関連するスケール要因であり、これは厳密なベンフォードの挙動からの逸脱を支配する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。