[논문 리뷰] What's Logs Got to do With it: On the Perils of log Dependent Variables and Difference-in-Differences
논문은 차이의 차이(DD) 설계에서 종속 변수를 로그로 변환하면 DD 추정치의 부호가 수준 명세와 다를 수 있음을 보여주며, 특히 기저 결과 분포가 그룹 간에 다를 때 그렇다. 부호 전환이 발생하는 조건을 제시하고 시뮬레이션과 두 개의 실증 사례를 통해 이를 입증한다.
The log transformation of the dependent variable is not innocuous when using a difference-in-differences (DD) model. With a dependent variable in logs, the DD term captures an approximation of the proportional difference in growth rates across groups. As I show with both simulations and two empirical examples, if the baseline outcome distributions are sufficiently different across groups, the DD parameter for a log-specification can be different in sign to that of a levels-specification. I provide a condition, based on (i) the aggregate time effect, and (ii) the difference in relative baseline outcome means, for when the sign-switch will occur.
연구 동기 및 목표
- 기능 형식(level vs. log)가 DD 추정에 미치는 영향을 강조한다.
- 기저 분포가 다를 때 DD 부호가 바뀌는 조건을 도출한다.
- 시뮬레이션으로 부호 전환 현상을 입증한다.
- 수준과 로그 명세에서 같은 데이터와 제어에 대해 반대 부호의 DD 추정치를 보이는 두 실증 사례를 제공한다.
제안 방법
- 수준 및 로그 변환된 결과를 모두 포함하는 DD 프레임워크를 제시하고 DD 매개변수와 성장 차이 간의 관계를 도출한다(식 3–7).
- 집합적 시점 효과와 기저 결과 차이를 바탕으로 부호 전환의 조건을 제시하는 명제 1을 개발한다.
- 부호 전환을 검증하고 시나리오를 설명하기 위한 시뮬레이션을 수행한다.
- 두 개의 실증 사례를 제시한다(대공황 수입/임금의 인종별; Brexit 주변 런던의 주택 가격)에서 수준 명세와 로그 명세 하의 부호가 다르게 나타남.
실험 결과
연구 질문
- RQ1수준-명세와 로그-명세 간의 부호 차이가 DD 추정에 따라 달라지는 조건은 무엇인가?
- RQ2기저 결과 분포 차이와 집계 시간 효과가 DD 추정의 부호 변화에 어떤 영향을 미치는가?
- RQ3실증 사례에서 수준 결과와 로그 결과가 서로 다른 부호의 DD 추정치를 보이는가?
주요 결과
- DD에서 로그 명세는 수준 변화가 아니라 성장률의 비례 차이를 근사한다(식 4–7).
- 기저 결과 분포가 충분히 다르고 비제로의 집계 시간 효과가 있을 때 수준과 로그 DD 추정치 사이에 부호 전환이 발생할 수 있다(제1명제).
- 시뮬레이션은 시간 효과를 고정한 채 기저 차이를 이동시키면 2x2 DD 셀 전반에서 명세에 따라 부호가 반대가 되는 DD 추정치를 생성할 수 있음을 보인다.
- 두 실증 사례(인종별 Great Recession의 수입; Brexit 주변 런던의 주택 가격) 동일한 데이터와 제어에서 수준과 로그 명세에 대해 부호가 다른 DD 추정치를 산출한다.
- 부호 전환은 기저 차이의 비율과 전체 시간 효과의 비율에 따라 달라지며, 아래 부등식으로 형식화된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.