QUICK REVIEW

[논문 리뷰] Estimating grouped data models with a binary dependent variable and fixed effects: What are the issues

Nathaniel Beck|arXiv (Cornell University)|2018. 09. 18.

Electoral Systems and Political Participation참고 문헌 8인용 수 23

한 줄 요약

이 논문은 사회과학 데이터에서 고정효과를 가진 이元변수 모형을 추정할 때 조건부 로짓(CLOGIT)이 OLS와 고정효과 로짓(FELOGIT)보다 우수하다고 주장한다. CLOGIT는 특히 작은 군집 크기 또는 많은 군집이 존재할 경우 더 정확한 모수 추정치와 경계 효과를 제공하며, CLOGIT의 추정치를 사전분포로 사용하는 제약 조건이 있는 FELOGIT 추정량을 제안함으로써 OLS보다 더 높은 효율성과 신뢰성을 확보한다.

ABSTRACT

This article deals with asimple issue: if we have grouped data with a binary dependent variable and want to include fixed effects (group specific intercepts) in the specification, is Ordinary Least Squares (OLS) in any way superior to a (conditional) logit form? In particular, what are the consequences of using OLS instead of a fixed effects logit model with respect to the latter dropping all units which show no variability in the dependent variable while the former allows for estimation using all units. First, we show that the discussion of fthe incidental parameters problem is based on an assumption about the kinds of data being studied; for what appears to be the common use of fixed effect models in political science the incidental parameters issue is illusory. Turning to linear models, we see that OLS yields a linear combination of the estimates for the units with and without variation in the dependent variable, and so the coefficient estimates must be carefully interpreted. The article then compares two methods of estimating logit models with fixed effects, and shows that the Chamberlain conditional logit is as good as or better than a logit analysis which simply includes group specific intercepts (even though the conditional logit technique was designed to deal with the incidental parameters problem!). Related to this, the article discusses the estimation of marginal effects using both OLS and logit. While it appears that a form of logit with fixed effects can be used to estimate marginal effects, this method can be improved by starting with conditional logit and then using the those parameter estimates to constrain the logit with fixed effects model. This method produces estimates of sample average marginal effects that are at least as good as OLS, and much better when group size is small or the number of groups is large. .

연구 동기 및 목표

이원변수 모형에 고정효과를 적용할 때 OLS, FELOGIT, CLOGIT 중 어떤 것을 써야 할지 적용 연구에서 혼동을 해결하기 위해.
일반적인 정치학 데이터에서 군집 수가 고정되어 있고 군집 크기가 변동할 때, 부수적 매개변수 문제(incidental parameters problem)가 고정효과 모형에 의미 있는 영향을 미치지 않는다는 점을 명확히 하기 위해.
군집 내 변화가 있는 그룹과 없는 그룹의 선형 조합에 의존하기 때문에 OLS가 경계 효과 추정에서 비효율적이고 오해의 소지가 있다는 점을 입증하기 위해.
CLOGIT 추정치를 사전분포로 사용하는 제약 조건이 있는 FELOGIT 추정량을 제안하고 평가하기 위해.
특히 군집 크기가 작거나 군집 수가 많을 경우 CLOGIT 기반의 경계 효과가 OLS보다 더 신뢰할 수 있다는 점을 보여주기 위해.

제안 방법

논문은 다양한 군집 크기와 성공 확률 하에서 시뮬레이션 연구를 통해 OLS, FELOGIT(더미 군집 효과를 가진 로짓), CLOGIT(Chamberlain의 조건부 로짓)를 비교한다.
CLOGIT를 기준으로 OLS와 제약 조건이 있는 FELOGIT의 상대적 정확도를 루트 평균 제곱오차(RMSE)를 통해 평가한다.
계수 추정치를 CLOGIT 추정치로 제약하는 제약 조건이 있는 FELOGIT 방법을 도입하여 효율성 향상과 편향 감소를 도모한다.
OLS와 제약 조건이 있는 FELOGIT 방법을 사용하여 표본 평균 경계 효과를 계산하고, 그 신뢰성과 불확실성을 평가한다.
특히 제약 조건이 있는 FELOGIT 프레임워크에서 불확실성을 보정하기 위해 시뮬레이션 기반 리샘플링을 사용한다.
이원변수 결과에서 많은 군집에서 변화가 없음을 보여주는 실제 데이터 패턴을 분석하여, OLS가 변화가 없는 군집을 정보가 있는 것으로 간주하지만 실제로는 그렇지 않다는 점을 밝힌다.

실험 결과

연구 질문

RQ1이원변수 결과에 고정효과를 적용할 때, 특히 종속변수에서 많은 군집에서 변화가 없을 경우 OLS가 고정효과 로짓 모형의 타당한 대안이 될 수 있는가?
RQ2일반적인 사회과학 데이터에서 군집 수가 고정되어 있을 때, 부수적 매개변수 문제가 고정효과 로짓(FELOGIT)을 무효화하는가?
RQ3특히 작은 군집 크기 또는 많은 군집 수가 존재할 경우, CLOGIT의 모수 추정 정확도는 FELOGIT보다 어떻게 다른가?
RQ4CLOGIT 추정치를 사전분포로 사용하는 제약 조건이 있는 FELOGIT 추정량은 OLS보다 경계 효과 추정의 정확도를 향상시킬 수 있는가?
RQ5군집 수준의 변화가 없을 경우 OLS는 경계 효과 추정에 신뢰할 수 있는 방법인가, 아니면 오해의 소지가 있는가?

주요 결과

FELOGIT가 거의 편향이 없더라도 CLOGIT는 충분통계량에 조건부로 설정함으로써 평균 제곱오차 측면에서 FELOGIT보다 더 정확하다.
CLOGIT 추정치를 사전분포로 사용하는 제약 조건이 있는 FELOGIT 추정량은 OLS 대비 경계 효과의 RMSE를 최대 25%까지 감소시키며, 특히 군집 크기가 작거나 군집 수가 많을 경우 유의미하다.
시뮬레이션 결과에 따르면, OLS는 효율성 측면에서 약 1/3의 데이터를 버리는 것과 동일하며, 제약 조건이 있는 FELOGIT는 OLS 대비 25%의 효율성 향상을 보였다.
군집 확률이 0.5 중심으로 설정된 시뮬레이션에서는 제약 조건이 있는 FELOGIT 추정량이 OLS 대비 8% 더 효율적이며, 높은 확률의 경우 최대 25% 더 효율적이다.
제약 조건이 있는 FELOGIT에서 경계 효과 추정의 불확실성은 리샘플링을 통해 잘 근사되며, 이 방법은 일반적으로 OLS보다 열등하지 않으며 종종 훨씬 더 낫다.
논문은 연구자들이 계산 비용이나 내생성 문제 제약이 심각하지 않은 한, OLS보다 제약 조건이 있는 FELOGIT 방법을 경계 효과 추정에 우선적으로 선택해야 한다고 결론 내린다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.