Skip to main content
QUICK REVIEW

[論文レビュー] Flexible modeling of nonnegative continuous data: Box-Cox symmetric regression and its zero-adjusted extension

Rodrigo M. R. de Medeiros, Francisco F. Queiroz|arXiv (Cornell University)|Jan 13, 2026
Statistical Methods and Bayesian Inference被引用数 0
ひとこと要約

本論文は Box-Cox 対称(BCS)回帰を正式化し、ゼロを含む正データに対するゼロ調整拡張(ZABCS)を導入。ML推定と診断手法を開発し、Rパッケージを提供するとともに基本教育支出データへの適用を行う。

ABSTRACT

The Box-Cox symmetric distributions constitute a broad class of probability models for positive continuous data, offering flexibility in modeling skewness and tail behavior. Their parameterization allows a straightforward quantile-based interpretation, which is particularly useful in regression modeling. Despite their potential, only a few specific distributions within this class have been explored in regression contexts, and zero-adjusted extensions have not yet been formally addressed in the literature. This paper formalizes the class of Box-Cox symmetric regression models and introduces a new zero-adjusted extension suitable for modeling data with a non-negligible proportion of observations equal to zero. We discuss maximum likelihood estimation, assess finite-sample performance through simulations, and develop diagnostic tools including residual analysis, local influence measures, and goodness-of-fit statistics. An empirical application on basic education expenditure illustrates the models' ability to capture complex patterns in zero-inflated and highly skewed nonnegative data. To support practical use, we developed the new BCSreg R package, which implements all proposed methods.

研究の動機と目的

  • 正のデータの Box-Cox 対称回帰モデルのクラスを形式化する。
  • ゼロを含む連続成分を持つゼロ調整 Box-Cox 対称分布と対応する回帰モデルを導入する。
  • モデル評価のための残差・影響度指標を含む診断法を開発する。
  • 提案手法を実装する R パッケージ(BCSreg)を提供し、データで illustration を行う。
  • ゼロ過剰性を持つ支出データセットでアプローチを実証し、歪度とゼロを捉える。

提案手法

  • 密度生成関数 r を用いた Box-Cox 対称(BCS)分布を定義し、変換変数 Z は切り捨てられた領域で標準正規分布となる。
  • BCS を拡張したゼロ調整BCS(ZABCS)を、ゼロでの点質量をBCS連続部と混合することにより実現する。
  • BCS 回帰を、位置 μ と分散 σ の二つのリンク可能成分を d1, d2 のリンクで表現し、非対称性を λ で導入する。
  • Y>0 の連続部と GLM のようなパラメータ α による離散的ゼロ成分を組み合わせたゼロ調整BCS回帰を定式化する。
  • 離散部(ゼロ)と連続部を分離可能とした最尤推定を導出し、二段階推定手順を提案する。
  • AIC によるモデル選択と、密度生成パラメータ ζ を選択する補助指標 Υζ、そして残差ベースの診断法(分位点残差、ペアソン残差、乱択分位点残差)を提案する。
Figure 1: Distribution of positive education expenditures. The main panel shows the density histogram for individuals with positive expenditures only, while the inset bar chart reports the proportion of individuals with zero and positive education expenditure.
Figure 1: Distribution of positive education expenditures. The main panel shows the density histogram for individuals with positive expenditures only, while the inset bar chart reports the proportion of individuals with zero and positive education expenditure.

実験結果

リサーチクエスチョン

  • RQ1Box-Cox 対称分布に基づく回帰モデルの広いクラスをどのように formalize するか?
  • RQ2BCS モデルをゼロの非無視的確率に対応するよう ZABCS にどう拡張するか?
  • RQ3BCS および ZABCS 回帰モデルのパラメータをどう推定し、適合度をどう評価するか?
  • RQ4BCS および ZABCS モデルの診断と残差解析にはどの方法が有効か?
  • RQ5有限サンプルおよび実データへの適用において、これらのモデルはどの程度実用的か?

主な発見

  • ZABCS フレームワークは GLM 的ゼロ成分と BCS 連続部を組み合わせてゼロを扱い、離散部と連続部の尤もらしさを分離可能にする。
  • 最尤推定量は正則性条件の下で一致性があり、漸近正規性を持つ。二段階の推定戦略を採用。
  • 有限サンプルのシミュレーションでは、標本サイズが大きいほどバイアスと RMSE が低下し、特にゼロ確率が小さい場合のカバレッジが改善。
  • 基本教育支出の実証的適用は、非常に歪んだ正のデータと多数のゼロを含むデータを捉えるモデル能力を示す(4,232 世帯のサンプルで約93%がゼロ)。
  • 提案手法を実装する R パッケージ(BCSreg)は BCS および ZABCS 回帰モデルの適合を可能にする。
  • 本フレームワークは λ と r を適切に選択した場合、BCNO, BCT, BCPE, および対数対称回帰などの既存モデルを特殊ケースとして包含する。
Flexible modeling of nonnegative continuous data: Box-Cox symmetric regression and its zero-adjusted extension

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。