[論文レビュー] Flexible modeling of nonnegative continuous data: Box-Cox symmetric regression and its zero-adjusted extension
本論文は Box-Cox 対称(BCS)回帰を正式化し、ゼロを含む正データに対するゼロ調整拡張(ZABCS)を導入。ML推定と診断手法を開発し、Rパッケージを提供するとともに基本教育支出データへの適用を行う。
The Box-Cox symmetric distributions constitute a broad class of probability models for positive continuous data, offering flexibility in modeling skewness and tail behavior. Their parameterization allows a straightforward quantile-based interpretation, which is particularly useful in regression modeling. Despite their potential, only a few specific distributions within this class have been explored in regression contexts, and zero-adjusted extensions have not yet been formally addressed in the literature. This paper formalizes the class of Box-Cox symmetric regression models and introduces a new zero-adjusted extension suitable for modeling data with a non-negligible proportion of observations equal to zero. We discuss maximum likelihood estimation, assess finite-sample performance through simulations, and develop diagnostic tools including residual analysis, local influence measures, and goodness-of-fit statistics. An empirical application on basic education expenditure illustrates the models' ability to capture complex patterns in zero-inflated and highly skewed nonnegative data. To support practical use, we developed the new BCSreg R package, which implements all proposed methods.
研究の動機と目的
- 正のデータの Box-Cox 対称回帰モデルのクラスを形式化する。
- ゼロを含む連続成分を持つゼロ調整 Box-Cox 対称分布と対応する回帰モデルを導入する。
- モデル評価のための残差・影響度指標を含む診断法を開発する。
- 提案手法を実装する R パッケージ(BCSreg)を提供し、データで illustration を行う。
- ゼロ過剰性を持つ支出データセットでアプローチを実証し、歪度とゼロを捉える。
提案手法
- 密度生成関数 r を用いた Box-Cox 対称(BCS)分布を定義し、変換変数 Z は切り捨てられた領域で標準正規分布となる。
- BCS を拡張したゼロ調整BCS(ZABCS)を、ゼロでの点質量をBCS連続部と混合することにより実現する。
- BCS 回帰を、位置 μ と分散 σ の二つのリンク可能成分を d1, d2 のリンクで表現し、非対称性を λ で導入する。
- Y>0 の連続部と GLM のようなパラメータ α による離散的ゼロ成分を組み合わせたゼロ調整BCS回帰を定式化する。
- 離散部(ゼロ)と連続部を分離可能とした最尤推定を導出し、二段階推定手順を提案する。
- AIC によるモデル選択と、密度生成パラメータ ζ を選択する補助指標 Υζ、そして残差ベースの診断法(分位点残差、ペアソン残差、乱択分位点残差)を提案する。

実験結果
リサーチクエスチョン
- RQ1Box-Cox 対称分布に基づく回帰モデルの広いクラスをどのように formalize するか?
- RQ2BCS モデルをゼロの非無視的確率に対応するよう ZABCS にどう拡張するか?
- RQ3BCS および ZABCS 回帰モデルのパラメータをどう推定し、適合度をどう評価するか?
- RQ4BCS および ZABCS モデルの診断と残差解析にはどの方法が有効か?
- RQ5有限サンプルおよび実データへの適用において、これらのモデルはどの程度実用的か?
主な発見
- ZABCS フレームワークは GLM 的ゼロ成分と BCS 連続部を組み合わせてゼロを扱い、離散部と連続部の尤もらしさを分離可能にする。
- 最尤推定量は正則性条件の下で一致性があり、漸近正規性を持つ。二段階の推定戦略を採用。
- 有限サンプルのシミュレーションでは、標本サイズが大きいほどバイアスと RMSE が低下し、特にゼロ確率が小さい場合のカバレッジが改善。
- 基本教育支出の実証的適用は、非常に歪んだ正のデータと多数のゼロを含むデータを捉えるモデル能力を示す(4,232 世帯のサンプルで約93%がゼロ)。
- 提案手法を実装する R パッケージ(BCSreg)は BCS および ZABCS 回帰モデルの適合を可能にする。
- 本フレームワークは λ と r を適切に選択した場合、BCNO, BCT, BCPE, および対数対称回帰などの既存モデルを特殊ケースとして包含する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。