[論文レビュー] A unifying approach for doubly-robust $\ell_1$ regularized estimation of causal contrasts
本稿は、標本分割とクロスフィットを用い、影響関数に一致する損失関数を用いることで、高次元設定下での因果対比の二重にロバストな ℓ₁-正則化推定の統一的枠組みを提案する。この手法は、2つのネイズ関数(例:アウトカム回帰または感受性スコア)の少なくとも一方が近似的にスパースである場合に、根-nの一致性と漸近正規性を保証するレート二重ロバスト性とモデル二重ロバスト性の両方を達成する。
We consider inference about a scalar parameter under a non-parametric model based on a one-step estimator computed as a plug in estimator plus the empirical mean of an estimator of the parameter's influence function. We focus on a class of parameters that have influence function which depends on two infinite dimensional nuisance functions and such that the bias of the one-step estimator of the parameter of interest is the expectation of the product of the estimation errors of the two nuisance functions. Our class includes many important treatment effect contrasts of interest in causal inference and econometrics, such as ATE, ATT, an integrated causal contrast with a continuous treatment, and the mean of an outcome missing not at random. We propose estimators of the target parameter that entertain approximately sparse regression models for the nuisance functions allowing for the number of potential confounders to be even larger than the sample size. By employing sample splitting, cross-fitting and $\ell_1$-regularized regression estimators of the nuisance functions based on objective functions whose directional derivatives agree with those of the parameter's influence function, we obtain estimators of the target parameter with two desirable robustness properties: (1) they are rate doubly-robust in that they are root-n consistent and asymptotically normal when both nuisance functions follow approximately sparse models, even if one function has a very non-sparse regression coefficient, so long as the other has a sufficiently sparse regression coefficient, and (2) they are model doubly-robust in that they are root-n consistent and asymptotically normal even if one of the nuisance functions does not follow an approximately sparse model so long as the other nuisance function follows an approximately sparse model with a sufficiently sparse regression coefficient.
研究の動機と目的
- 標本サイズを上回る数の交絡要因が存在する高次元観察研究における因果対比の推定のための統一的アプローチを開発すること。
- 既存の二重ロバスト手法を拡張し、同時にレート二重ロバスト性とモデル二重ロバスト性を達成すること。
- 少なくとも一方のネイズ関数が非スパースであっても、他方が近似的にスパースである限り、推定量の根-nの一致性と漸近正規性を保証すること。
- ATE(平均処置効果)を超えて、連続処置効果や欠損データパラメータを含む、より広範な因果関数型への一般化を図ること。
- 標本分割、クロスフィット、影響関数に一致する損失関数を用いた ℓ₁-正則化回帰を組み合わせた、理論的裏付けが明確で実用的な枠組みを提供すること。
提案手法
- 推定量は、プラグイン推定と影響関数推定の経験的平均に基づく1段階推定量を用いる。
- 高次元設定下での過剰適合に起因するバイアスを低減するため、標本分割とクロスフィットを採用する。
- ネイズ関数(例:アウトカム回帰や感受性スコア)は、方向微分が影響関数と一致する目的関数を用いた ℓ₁-正則化回帰で推定する。
- 本手法は、少なくとも一方のネイズ関数が近似的にスパースである場合に、根-nの一致性と漸近正規性を保証する「レート二重ロバスト」である。
- また、一方のネイズ関数が近似的にスパースであれば、他方のスパース性にかかわらず、根-nの一致性と漸近正規性を保証する「モデル二重ロバスト」である。
- 本枠組みは、ATE、ATT、連続処置対比、非消失欠損メカニズム下での平均アウトカムなど、広範な関数型に適用可能である。
実験結果
リサーチクエスチョン
- RQ1一貫した手法が高次元因果推論において、同時にレート二重ロバスト性とモデル二重ロバスト性を達成できるか?
- RQ21つのネイズ関数が非スパースである場合に、ℓ₁-正則化推定をどのように適合させればロバスト性を確保できるか?
- RQ3目標パラメータの影響関数に一致させるために、ℓ₁-正則化推定に最適な損失関数は何か?
- RQ4漸近理論が標本分布をうまく近似できない場合でも、有限標本性能が良好に保たれるか?
- RQ5本枠組みは、ATEを超えて、条件付き平均関数の連続線形関数型のクラスに属する他の因果関数型へ一般化可能か?
主な発見
- 提案された推定量は、少なくとも一方のネイズ関数が近似的にスパースである場合に、レート二重ロバスト性とモデル二重ロバスト性を両方達成し、根-nの一致性と漸近正規性を保証する。
- シミュレーションでは、ダブルロバスト推定量を中心とするWald信頼区間の被覆率は、ほとんどの状況で名目水準の95%に近く維持されたが、漸近近似が悪い場合には外れた。
- 真の関数が極めてスパースでない場合(例:αₐ = 1.5)、漸近理論は正規性を保証せず、バイアスが観察された。これは有限標本の制限を示唆している。
- 共変数の数を200から100に減らした場合、ダブルロバスト推定量のバイアスは標準誤差のオーダーをはるかに下回り、有限標本性能が向上した。
- 標準誤差推定量は真の変動を低く見積もる傾向があり、特にp=200の場合に95%信頼区間の被覆率が不足した。
- 一部のケースでは、正しいモデル化がなされたネイズ関数に基づくナーブ推定量が、ダブルロバスト推定量と同等またはより小さいバイアスを示した。これは、特定のデータ生成過程において不安定性やモデル特有のアーチファクトが生じる可能性を示唆している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。