[論文レビュー] Logs with zeros? Some problems and solutions
本論文は、ゼロ値のアウトカムを含む対数様変換のATEが任意のスケールに依存しうること、単位不変なパーセンテージ効果として解釈できないことを示す。代替案と三難問題を概説し、実証的な事例を示す。
When studying an outcome $Y$ that is weakly-positive but can equal zero (e.g. earnings), researchers frequently estimate an average treatment effect (ATE) for a "log-like" transformation that behaves like $\log(Y)$ for large $Y$ but is defined at zero (e.g. $\log(1+Y)$, $\mathrm{arcsinh}(Y)$). We argue that ATEs for log-like transformations should not be interpreted as approximating percentage effects, since unlike a percentage, they depend on the units of the outcome. In fact, we show that if the treatment affects the extensive margin, one can obtain a treatment effect of any magnitude simply by re-scaling the units of $Y$ before taking the log-like transformation. This arbitrary unit-dependence arises because an individual-level percentage effect is not well-defined for individuals whose outcome changes from zero to non-zero when receiving treatment, and the units of the outcome implicitly determine how much weight the ATE for a log-like transformation places on the extensive margin. We further establish a trilemma: when the outcome can equal zero, there is no treatment effect parameter that is an average of individual-level treatment effects, unit-invariant, and point-identified. We discuss several alternative approaches that may be sensible in settings with an intensive and extensive margin, including (i) expressing the ATE in levels as a percentage (e.g. using Poisson regression), (ii) explicitly calibrating the value placed on the intensive and extensive margins, and (iii) estimating separate effects for the two margins (e.g. using Lee bounds). We illustrate these approaches in three empirical applications.
研究の動機と目的
- 結果がゼロになり得る場合に対数様変換の利用を動機づけ、発生する解釈上の問題を特定する。
- 対数様変換のATEが、処置によって広範囲マージン(extensive margin)が影響を受ける場合にスケール依存であることを示す。
- 三難問題を示す: ゼロの結果の下では、個別効果の平均、単位不変、点推定を同時に満たすパラメータは存在しない。
- 外生と内生の margins を持つ settings に対する代替のターゲットパラメータと推定戦略を提案する。
- 実証的な適用を通じてアプローチを実例で示し、研究者への実務的含意を論じる。
提案手法
- 大きな y に対しては log(y) のように機能するが、0 でも定義される m(y)(例: log(1+y), arcsinh(y))を定義する。
- 処置が外生的マージン(ゼロと正のアウトカム)に影響を与える場合、m(Y) の ATE は単位を再スケールすることで任意の大きさにスケーリングでき、単位依存性を含意することを証明する。
- 三難問題を確立する:ゼロ値のアウトカムの下で、パラメータは個別効果の平均、単位不変、点識別を同時に満たすものにはなり得ない。
- 代替パラメータを議論する(例:Poisson 回帰によるレベルでの ATE%、マージンの明示的キャリブレーション、境界や追加仮定による別のマージンの推定)。
- 代替パラメータを推定する設計図を提供し、3つの実証設定(RCT、DiD、IV)に適用する。

実験結果
リサーチクエスチョン
- RQ1処置群と対照群でアウトカムがゼロになり得るとき、対数様変換はどう振る舞うか。
- RQ2ゼロおよび外生マージンが存在する場合、対数様変換のATEを単位不変なパーセント効果として解釈できるか。
- RQ3ゼロ値アウトカムとマージンが存在する場合、どのような代替的因果パラメータと推定戦略が妥当か。
- RQ4これらの代替案は、集中と広範なマージンを持つ実証応用でどの程度機能するか。
主な発見
- 広範なマージンが影響を受ける場合、対数様変換のATEは Y の単位に対して任意に敏感である。
- ゼロが生じ得る場合、個別効果の平均、単位不変、点識別のいずれも同時に満たす処置効果パラメータは存在しない。
- 代わりにレベルベースのパーセンテージ(例:Poisson 回帰によるレベルでの ATE%)を用いる、あるいは集中マージンと広範マージンの値を明示的にキャリブレーションする、または別個のマージンを推定することができる。
- 感度分析は、アウトカムを因子で再スケールすると、対数様変換のATEがスケーリングの対数程度だけ変化することを示し、それは主に広範マージンの効果による。
- 本論文は、AERの論文で arcsinh(Y) や log(1+Y) を用いた際の顕著なスケーリング感度を示す実証的事例を提供する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。