QUICK REVIEW

[논문 리뷰] Machine Learning Estimation of Heterogeneous Treatment Effects with Instruments

Vasilis Syrgkanis, Victor Lei|arXiv (Cornell University)|2019. 05. 24.

Advanced Causal Inference Techniques참고 문헌 21인용 수 31

한 줄 요약

이 논문은 관찰되지 않은 혼란 요인 존재 하에서 산술 변수(IVs)를 사용하여 이질적 치료 효과를 추정하기 위한 머신러닝 프레임워크를 제안한다. 손실 함수에 보조 모델을 통합하는 방식으로 문제를 최소화함으로써, 현대적 머신러닝 알고리즘(예: 신경망, 랜덤 포레스트)의 사용이 가능해지고, 부수적 모델의 추정 오차에 대해 강건성을 확보하여 渐近적으로 정규분포를 따르는 추정치와 타당한 신뢰구간을 제공한다.

ABSTRACT

We consider the estimation of heterogeneous treatment effects with arbitrary machine learning methods in the presence of unobserved confounders with the aid of a valid instrument. Such settings arise in A/B tests with an intent-to-treat structure, where the experimenter randomizes over which user will receive a recommendation to take an action, and we are interested in the effect of the downstream action. We develop a statistical learning approach to the estimation of heterogeneous effects, reducing the problem to the minimization of an appropriate loss function that depends on a set of auxiliary models (each corresponding to a separate prediction task). The reduction enables the use of all recent algorithmic advances (e.g. neural nets, forests). We show that the estimated effect model is robust to estimation errors in the auxiliary models, by showing that the loss satisfies a Neyman orthogonality criterion. Our approach can be used to estimate projections of the true effect model on simpler hypothesis spaces. When these spaces are parametric, then the parameter estimates are asymptotically normal, which enables construction of confidence sets. We applied our method to estimate the effect of membership on downstream webpage engagement on TripAdvisor, using as an instrument an intent-to-treat A/B test among 4 million TripAdvisor users, where some users received an easier membership sign-up process. We also validate our method on synthetic data and on public datasets for the effects of schooling on income.

연구 동기 및 목표

비준수와 관찰되지 않은 혼란 요인이 존재하는 상황에서 치료 할당이 내생적일 때 이질적 치료 효과를 추정하는 데 도전하는 것.
랜덤 포레스트, 신경망 등 현대적 머신러닝 방법을 산술 변수 회귀에 통합하여 복잡한 비모수적 효과 모델링을 가능하게 하는 것.
네이먼 수직성(Neyman orthogonality)을 통해 부수적 모델의 오차에 대한 효과 추정의 강건성을 확보하는 것.
매개변수 모델에 효과 모델을 투영할 때 渐近적으로 정규분포를 따르는 추정기와 타당한 신뢰구간을 구성할 수 있도록 하는 것.
실제 데이터(TripAdvisor)와 시뮬레이션 데이터(NLSYM)를 통해 방법을 검증하여, 더 나은 커버리지와 감소된 편향을 입증하는 것.

제안 방법

이 방법은 이질적 IV 추정 문제를 가설 공간 위에서 제곱 손실 최소화 문제로 환원하며, 더블 머신러닝 유사 접근법을 활용한다.
손실 함수는 결과, 치료, 도구 변수에 대한 보조 모델에 의존하며, 강건성을 확보하기 위해 네이먼 수직성을 보장한다.
이 방법은 부수적 기능을 추정하기 위해 어떤 블랙박스 머신러닝 알고리즘(예: 기울기 부스팅, 신경망)을 사용할 수 있다.
최종 효과 모델은 두 단계 과정을 통해 추정된다: 첫째, 부수적 모델이 피팅된다; 둘째, 편향을 제거하는 손실 함수를 최소화하여 효과가 추정된다.
효과 모델을 매개변수 공간에 투영할 때, 해당 추정된 계수는 渐近적으로 정규분포를 따르며, 이는 신뢰구간 구성이 가능하게 한다.
이 방법은 비모수적 및 매개변수적 효과 추정을 모두 지원하며, 평균 제곱오차율에 대한 이론적 보장을 제공한다.

실험 결과

연구 질문

RQ1현대적 머신러닝 방법을 산술 변수 회귀와 효과적으로 융합하여 이질적 치료 효과를 추정할 수 있는가?
RQ2보조 모델의 추정 오차를 어떻게 통제하여 이질적 효과 추정의 강건성을 확보할 수 있는가?
RQ3매개변수 모델에 효과를 투영할 때 제안된 방법이 효과 계수에 대해 타당한 신뢰구간을 제공하는가?
RQ4유한 표본에서 기존 방법(DMLATEIV, IV 포레스트 등)과 비교해 볼 때, 이 방법은 편향과 커버리지 측면에서 어떻게 성능을 내는가?
RQ5비준수 이질성과 관찰되지 않은 혼란 요인이 존재하는 환경에서 이 방법은 진짜 치료 효과를 회복할 수 있는가?

주요 결과

시뮬레이션 데이터에서 제안된 DRIV 방법은 100회의 몬테카를로 시뮬레이션 동안 98%의 신뢰구간 커버리지율을 기록했으며, DMLATEIV의 경우 뿐만 52%에 그쳤다. 이는 더 나은 유한표본 성능을 보여준다.
반시뮬레이션 NLSYM 데이터셋에서 DRIV는 DMLATEIV보다 더 낮은 편향을 보였다(GBM 기반: 0.041, 선형모형 기반: 0.072), DMLATEIV는 각각 0.157과 0.137이었으며, 커버리지율은 각각 93%와 98%였다.
400만 명의 사용자가 포함된 실세계 TripAdvisor 데이터에서, 이 방법은 참여자 등록이 웹페이지 참여도에 긍정적인 영향을 미친다고 추정했으며, 의도에 따라 치료된 A/B 테스트를 도구변수로 활용했다.
이 방법은 어머니의 교육 수준이 낮은 사용자에서 치료 효과가 가장 높다는 것을 성공적으로 식별했으며, 이는 문헌에서 이전에 보고된 결과와 일치한다.
효과 모델을 선형 모델에 투영했을 때, 어머니의 교육 수준 계수에 대한 신뢰구간은 95%의 경우에 진짜 값을 포함하여 타당한 추론을 확인했다.
부수적 모델의 잘못된 지정에 대해서도 이 방법은 강건성을 보였으며, 평균 제곱오차율은 효과 모델의 가설 공간의 복잡도에만 의존하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.