[論文レビュー] Leveraging Random Assignment to Impute Missing Covariates in Causal Studies
本稿は、無作為化実験における欠損共変量の補完手法において、無作為化割り当てを活用する影響を調査する。複数の補完法(多重補完、回帰補完、平均補完)を用いて、設計段階と結果段階の補完戦略を比較した結果、無作為化を考慮しても推定精度の向上はわずかであり、結果に基づく補完はバイアスが増加するため、しばしばより悪い性能を示すことがわかった。
Baseline covariates in randomized experiments are often used in the estimation of treatment effects, for example, when estimating treatment effects within covariate-defined subgroups. In practice, however, covariate values may be missing for some data subjects. To handle missing values, analysts can use imputation methods to create completed datasets, from which they can estimate treatment effects. Common imputation methods include mean imputation, single imputation via regression, and multiple imputation. For each of these methods, we investigate the benefits of leveraging randomized treatment assignment in the imputation routines, that is, making use of the fact that the true covariate distributions are the same across treatment arms. We do so using simulation studies that compare the quality of inferences when we respect or disregard the randomization. We consider this question for imputation routines implemented using covariates only, and imputation routines implemented using the outcome variable. In either case, accounting for randomization offers only small gains in accuracy for our simulation scenarios. Our results also shed light on the performances of these different procedures for imputing missing covariates in randomized experiments when one seeks to estimate heterogeneous treatment effects.
研究の動機と目的
- 無作為化割り当てを補完手順に組み込むことで、欠損共変量を伴う無作為化実験における推定精度が向上するかどうかを評価すること。
- 無視可能および非無視的欠損メカニズムの下で、設計段階と結果段階の補完法の性能を比較すること。
- 無作為化を尊重するか無視するかの状況下で、平均補完、回帰補完、多重補完の相対的な利点を評価すること。
- 補完戦略が異質的処置効果の推定に与える影響を検討すること。
- 無作為化下での因果推論において、欠損共変量を扱うための最良の実践法を提供すること。
提案手法
- 無視可能および非無視的欠損メカニズムの下で、欠損共変量を伴う無作為化実験をシミュレートする。
- 4つの多重補完戦略を実装する:MI-R(設計段階、無作為化を尊重)、MI-NR(設計段階、無作為化を無視)、MI-RY(結果段階、無作為化を尊重)、MI-NRY(結果段階、無作為化を無視)。
- 単一補完法(平均補完および回帰補完)を、結果変数を含める・含めないの両方の状況で適用する。
- ルービンの多重補完フレームワークを用い、複数の補完済みデータセットの結果をルービンのルールに従って統合する。
- 交互作用項を含める・含めないで処置効果を推定し、異質的処置効果の評価を行う。
- バイアス、分散、被覆率、平均信頼区間長さを用いて性能を評価する。
実験結果
リサーチクエスチョン
- RQ1欠損共変量を伴う無作為化実験において、補完手順に無作為化を活用することで、処置効果推定の精度が向上するか?
- RQ2異質的処置効果を推定する際、バイアス、分散、被覆率の観点から、設計段階と結果段階の補完法はどのように比較されるか?
- RQ3欠損共変量の補完モデルに結果変数を含めることの影響は何か?
- RQ4平均補完、回帰補完、多重補完といった異なる補完法は、共変量と結果の関連性の程度や欠損メカニズムの違いに応じて、どのように性能を示すか?
- RQ5どのような条件下で、無作為化を尊重する補完法が、無視するものよりも優れるか?
主な発見
- 無作為化を補完手順に活用しても、中程度の規模の実験でさえも、推定精度の向上はわずかにとどまる。
- 結果変数を補完モデルに含む多重補完法(MI-RYおよびMI-NRY)は、設計段階の方法(MI-RおよびMI-NR)と比較して、バイアスは低く抑えられるが、分散が高くなる傾向にある。
- 設計段階の補完に平均補完を用いることで、サンプルサイズが大きい場合には、ほぼ名目水準の被覆率が得られ、バイアスは小さく、信頼区間長さも妥当な水準を示す。
- 結果に基づく補完法は、設計段階の方法と比較して一貫して性能が劣り、特に共変量が結果を強く予測する場合に顕著なバイアスが生じる。
- 共変量と結果の関連性が低い場合には、すべてのMI法が低バイアスを示すが、MI-RおよびMI-NRはMI-RYおよびMI-NRYよりも効率的である。
- 極めて大きなサンプルサイズ(例:100,000対100,000)では、MI-RおよびMI-NRは持続的なバイアスに見舞われ、標準誤差を上回るため、被覆率は名目水準を著しく下回るが、結果段階の方法はより良好な被覆率を維持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。