QUICK REVIEW

[論文レビュー] Machine Learning Estimation of Heterogeneous Treatment Effects with Instruments

Vasilis Syrgkanis, Victor Lei|arXiv (Cornell University)|May 24, 2019

Advanced Causal Inference Techniques参考文献 21被引用数 31

ひとこと要約

本稿では、観察されない交絡要因が存在する状況下で、道具用変数（IV）を用いた非定型処置効果の推定のための機械学習フレームワークを提案する。問題を補助モデルを組み込んだ損失関数の最小化問題に還元することで、ニューラルネットワークやランダムフォレストなどの現代的機械学習アルゴリズムの使用が可能となり、ネズミン直交性により補助モデルの推定誤差に対してもロバストである。その結果、有効な信頼区間を伴う漸近正規推定量が得られる。

ABSTRACT

We consider the estimation of heterogeneous treatment effects with arbitrary machine learning methods in the presence of unobserved confounders with the aid of a valid instrument. Such settings arise in A/B tests with an intent-to-treat structure, where the experimenter randomizes over which user will receive a recommendation to take an action, and we are interested in the effect of the downstream action. We develop a statistical learning approach to the estimation of heterogeneous effects, reducing the problem to the minimization of an appropriate loss function that depends on a set of auxiliary models (each corresponding to a separate prediction task). The reduction enables the use of all recent algorithmic advances (e.g. neural nets, forests). We show that the estimated effect model is robust to estimation errors in the auxiliary models, by showing that the loss satisfies a Neyman orthogonality criterion. Our approach can be used to estimate projections of the true effect model on simpler hypothesis spaces. When these spaces are parametric, then the parameter estimates are asymptotically normal, which enables construction of confidence sets. We applied our method to estimate the effect of membership on downstream webpage engagement on TripAdvisor, using as an instrument an intent-to-treat A/B test among 4 million TripAdvisor users, where some users received an easier membership sign-up process. We also validate our method on synthetic data and on public datasets for the effects of schooling on income.

研究の動機と目的

処置割り当てが非順守および観察されない交絡要因のため内生的である状況下で、非定型処置効果を推定する課題に対処すること。
ランダムフォレストやニューラルネットワークなどの現代的機械学習手法を、複雑な非パラメトリック効果モデリングのための道具用変数回帰に統合すること。
ネズミン直交性を用いて、補助のネイジューイモデルの誤差に対して効果推定量のロバスト性を保証すること。
パラメトリックモデルへの効果の射影を行う際、漸近正規推定量の構築と有効な信頼区間の構成を可能にすること。
実世界のデータ（TripAdvisor）および合成／シミュレーテッドデータ（NLSYM）を用いて、本手法の妥当性を検証し、カバレッジの向上とバイアスの低減を示すこと。

提案手法

本手法は、仮説空間上での二乗損失最小化問題に還元することで、非定型IV推定を簡略化する。これは、ダブルマシンラーニング型の手法を用いる。
補助モデル（結果、処置、道具用変数）に依存する損失関数を導入し、ロバスト性を確保するためのネズミン直交性を満たす。
任意のブラックボックス機械学習アルゴリズム（例：勾配ブースティング、ニューラルネット）を、ネイジューイ関数の推定に使用可能である。
最終的な効果モデルは、2段階のプロセスで推定される：まず、ネイジューイモデルをフィッティングし、次に、バイアスを補正する損失関数の最小化により効果を推定する。
効果モデルをパラメトリック空間に射影する場合、得られるパrameter推定量は漸近正規となり、信頼区間の構築が可能になる。
本手法は非パラメトリックおよびパラメトリックな効果推定をサポートし、平均二乗誤差率について理論的保証が得られる。

実験結果

リサーチクエスチョン

RQ1現代の機械学習手法を、道具用変数回帰と効果的に組み合わせ、非定型処置効果を推定できるか？
RQ2補助モデルの推定誤差をどのように制御することで、非定型効果推定のロバスト性を確保できるか？
RQ3パラメトリックモデルへの射影を行う際、効果パrameterの有効な信頼区間が得られるか？
RQ4有限標本におけるバイアスとカバレッジの観点から、本手法は既存の手法（例：DMLATEIV、IVフォレスト）と比較してどのように異なるか？
RQ5非順守と観察されない交絡要因が存在する状況でも、真の処置効果を回復できるか？

主な発見

合成データでは、100回のモンテカルロシミュレーションにおいて、本手法のDRIVは98％の信頼区間カバレッジを達成したのに対し、DMLATEIVは52％にとどまり、有限標本における性能が優れていることが示された。
準合成NLSYMデータセットでは、DRIVはDMLATEIVよりもバイアスの小さいATE推定値（GBMで0.041、LMで0.072）を生成し、カバレッジ率はそれぞれ93％および98％であった。
400万人のユーザーを含む実世界のTripAdvisorデータでは、意図した処置A/Bテストを道具用変数として用い、会員登録の有無がページ表示時間に正の効果をもたらすことが推定された。
本手法は、母親の教育水準が低いユーザーにおいて効果が最も高かったことを特定し、先行研究の結果と整合的であった。
効果モデルを線形モデルに射影した場合、母親の教育水準の係数の信頼区間は95％の確率で真の値をカバーしており、有効な推論が可能であることを確認した。
本手法は、ネイジューイモデルの誤指定に対してもロバストであり、平均二乗誤差率は効果モデルの仮説空間の複雑さにのみ依存していた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。