QUICK REVIEW

[논문 리뷰] High-dimensional doubly robust tests for regression parameters

Oliver Dukes, Vahe Avagyan|arXiv (Cornell University)|2018. 05. 17.

Statistical Methods and Inference참고 문헌 27인용 수 8

한 줄 요약

이 논문은 더 이상의 스파arsity 조건이 필요로 하지 않으며, 노출 또는 결과에 대한 워킹 모델 중 하나가 잘못 지정되어도 여전히 유효한 고차원 이중로버스트 검정을 제안한다. 이 방법은 표본 분할 없이 펜라이즈드 최대우도 추정을 사용하여 기존 소프트웨어로 간편하게 구현 가능하면서도 모형 오류에 강건함을 보장한다.

ABSTRACT

After variable selection, standard inferential procedures for regression parameters may not be uniformly valid; there is no finite sample size at which a standard test is guaranteed to attain its nominal size (within pre-specified error margins). This problem is exacerbated in high-dimensional settings, where variable selection becomes unavoidable. This has prompted a flurry of activity in developing uniformly valid hypothesis tests for a low-dimensional regression parameter (e.g. the causal effect of an exposure A on an outcome Y) in high-dimensional models. So far there has been limited focus on model misspecification, although this is inevitable in high-dimensional settings. We propose tests of the null that are uniformly valid under sparsity conditions weaker than those typically invoked in the literature, assuming working models for the exposure and outcome are both correctly specified. When one of the models is misspecified, by amending the procedure for estimating the nuisance parameters, our tests continue to be valid; hence they are then doubly robust. Our proposals are straightforward to implement using existing software for penalized maximum likelihood estimation and do not require sample-splitting. We illustrate them in simulations and an analysis of data obtained from the Ghent University Intensive Care Unit.

연구 동기 및 목표

변수 선택 이후 고차원 설정에서 회귀 매개변수에 대한 균일한 유효한 추론이 부족한 문제를 해결하기 위해.
이전에 요구되었던 것보다 더 약한 스파arsity 가정 하에서도 유효한 검정을 개발하기 위해.
노출 모형 또는 결과 모형 중 하나가 잘못 지정되어도 유효성을 유지하는 이중로버스트성 달성하기 위해.
펜라이즈드 최대우도 추정을 위한 표준 소프트웨어로 쉽게 적용 가능한 실용적 방법 제공하기 위해.
표본 분할이 필요 없도록 하여 효율성을 저하시키고 구현을 복잡하게 만들지 않기 위해.

제안 방법

이 방법은 노출 및 결과 워킹 모델을 모두 포함하는 추정 방정식을 기반으로 한 검정 통계량을 구성한다.
고차원 설정에서 불편 매개변수를 추정하기 위해 펜라이즈드 최대우도 추정을 사용한다.
편향을 보정하기 위해 영향 함수 또는 추정 방정식을 통합하여 모형 오류를 보정하는 방식으로 검정 통계량을 조정한다.
이전 방법보다 더 약한 스파arsity 조건 하에서도 크기를 통제함으로써 균일한 유효성을 보장한다.
표본 분할이 필요 없어, 추정 효율성을 유지하고 구현을 단순화한다.
펜라이즈드 우도 추정을 위한 기존 소프트웨어를 활용하여 광범위한 접근성과 실용적 구현을 가능하게 한다.

실험 결과

연구 질문

RQ1더 약한 스파arsity 가정 하에서도 고차원 모형에서 저차원 회귀 매개변수에 대해 균일한 유효한 검정을 개발할 수 있는가?
RQ2표본 분할 없이 고차원 설정에서 이중로버스트성을 달성하는 방법은 무엇인가?
RQ3모형 오류가 추론에 미치는 영향은 무엇이며, 고차원 회귀에서 이를 어떻게 수정할 수 있는가?
RQ4표본을 분할하지 않고도 펜라이즈드 최대우도 추정을 사용해 유효한 검정을 구성할 수 있는가?
RQ5제안된 검정은 기존 방법과 비교해 유한 표본에서 어떻게 성능을 발휘하는가?

주요 결과

제안된 검정은 문헌에서 일반적으로 가정되는 것보다 더 약한 스파arsity 조건 하에서도 균일한 유효성을 유지한다.
노출 모형 또는 결과 모형 중 하나가 잘못 지정되어도 검정이 여전히 유효하여 이중로버스트성을 달성한다.
표본 분할이 필요 없어 통계적 효율성을 유지하고 구현을 단순화한다.
표준 소프트웨어를 사용해 펜라이즈드 최대우도 추정을 통해 구현 가능하다.
안트워프 대학교 집중치료실의 시뮬레이션 및 실데이터 분석을 통해 방법의 강건성과 실용적 유용성이 입증된다.
모형 오류가 있는 경우를 포함한 다양한 고차원 시나리오에서 검정은 명목상 크기 제어를 달성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.