Skip to main content
QUICK REVIEW

[論文レビュー] Model-assisted inference for treatment effects using regularized calibrated estimation with high-dimensional data

Zhiqiang Tan|arXiv (Cornell University)|Jan 30, 2018
Advanced Causal Inference Techniques参考文献 31被引用数 20
ひとこと要約

本稿では、高次元の観察的研究における平均処置効果推定のための正則化されたキャリブレート推定法を提案する。Lasso正則化モデルに特別に設計された損失関数を用いることで、二重にロバストでモデル補助的な信頼区間を達成する。この手法は、アウトカム回帰モデルまたは感受性スコアモデルのいずれかが誤指定されても有効な推論を保証し、シミュレーションおよび実応用において標準的な正則化最尤推定法を上回る性能を示す。

ABSTRACT

Consider the problem of estimating average treatment effects when a large number of covariates are used to adjust for possible confounding through outcome regression and propensity score models. The conventional approach of model building and fitting iteratively can be difficult to implement, depending on ad hoc choices of what variables are included. In addition, uncertainty from the iterative process of model selection is complicated and often ignored in subsequent inference about treatment effects. We develop new methods and theory to obtain not only doubly robust point estimators for average treatment effects, which remain consistent if either the propensity score model or the outcome regression model is correctly specified, but also model-assisted confidence intervals, which are valid when the propensity score model is correctly specified but the outcome regression model may be misspecified. With a linear outcome model, the confidence intervals are doubly robust, that is, being also valid when the outcome model is correctly specified but the propensity score model may be misspecified. Our methods involve regularized calibrated estimators with Lasso penalties, but carefully chosen loss functions, for fitting propensity score and outcome regression models. We provide high-dimensional analysis to establish the desired properties of our methods under comparable conditions to previous results, which give valid confidence intervals when both the propensity score and outcome regression are correctly specified. We present a simulation study and an empirical application which confirm the advantages of the proposed methods compared with related methods based on regularized maximum likelihood estimation.

研究の動機と目的

  • 多くの共変量が存在する状況での平均処置効果を推定する課題に対処すること。この場合、交絡要因の調整が不可欠である。
  • 繰り返し行われる、恣意的な変数選択に依存する従来のモデル構築手法の限界を克服すること。これらの手法は、モデル選択の不確実性を無視している。
  • アウトカム回帰モデルまたは感受性スコアモデルのいずれかが誤指定されても、有効な信頼区間を提供する手法を開発すること。これにより、ロバストな推論が保証される。
  • 適切に選ばれた損失関数を用いた正則化推定を用いて、高次元設定における二重にロバストな推論を拡張すること。

提案手法

  • 感受性スコアモデルの適合に、Lassoペナルティを用いた正則化されたキャリブレート推定量を用いる。損失関数は、望ましい漸近的性質を確保するために特に設計されている。
  • アウトカム回帰モデルに、正則化された重み付き尤度推定量を用いる。損失関数は、二重にロバスト性とモデル補助的推論を維持するために調整されている。
  • アウトカムモデルの交差検証中に、正則化されたキャリブレート推定量から得た感受性スコアの係数を固定することで、安定性と一貫性を確保する。
  • 加重逆確率化重み付け(AIPW)推定量を適用し、アウトカム回帰と感受性スコアの予測値を組み合わせて平均処置効果を推定する。
  • チューニングパラメータの選択に交差検証を実装し、高次元設定におけるバイアスと分散の最適なバランスを確保する。
  • スパarsity仮定の下で理論的性質を導出し、感受性スコアモデルまたはアウトカムモデルのいずれかが正しく指定されていれば、信頼区間が有効であることを示す。

実験結果

リサーチクエスチョン

  • RQ1正則化されたキャリブレート推定は、多数の共変量が存在する高次元設定における平均処置効果推定の推論を改善できるか?
  • RQ2アウトカム回帰モデルまたは感受性スコアモデルのいずれかが誤指定されても、提案手法が有効な信頼区間を維持できるか?
  • RQ3バイアス、分散、カバレッジの観点から、正則化されたキャリブレート推定量は、標準的な正則化最尤推定法と比較してどのように性能を発揮するか?
  • RQ4スパarsity仮定の下で、本手法は二重にロバストな推論を達成できるか?

主な発見

  • 提案手法は二重にロバストな点推定を達成し、感受性スコアモデルまたはアウトカム回帰モデルのいずれかが正しく指定されていれば一貫性を保つ。
  • 感受性スコアモデルが正しければ、信頼区間はモデル補助的であり、有効である。これは、アウトカム回帰モデルが誤指定されていても同様に成り立つ。逆も同様である。
  • n=800、p=200のシミュレーションにおいて、線形アウトカム構成1ではRCAL.RWL法が90%信頼区間で83.7%のカバレッジを達成した。これに対してRML.RML法は79.0%であった。
  • 95%信頼区間では、RCAL.RWL法が構成1で91.2%のカバレッジを示したのに対し、RML.RML法は85.9%であった。これは、カバレッジの精度が向上していることを示している。
  • 特に真の交絡要因構造が複雑な状況では、他の手法と比較してバイアスが低く、分散の推定がより効率的であった。
  • 実応用結果から、特にアウトカムモデルが誤指定されても感受性スコアモデルが正しければ、提案手法が有効な推論を維持することが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。