[論文レビュー] The choice to define competing risk events as censoring events and implications for causal inference
この論文は、競合リスクを打ち切り事象として定義することは、因果推定量の選択に対応することを明確にし、この選択を標準的な統計用語(例えば、サブダイレクトハザードやコーズスペシフィックハザード)と結びつける。時間に依存する要因に依存する打ち切りが生じる状況では従来の手法が失敗することを示し、このような状況下で有効な因果推定を回復するため、ロビンズのg-フォーミュラの使用を提唱する。
In failure-time settings, a competing risk event is any event that makes it impossible for the event of interest to occur. Different analytical methods are available for estimating the effect of a treatment on a failure event of interest that is subject to competing events. The choice of method depends on whether or not competing events are defined as censoring events. Though such definition has key implications for the causal interpretation of a given estimate, explicit consideration of those implications has been rare in the statistical literature. As a result, confusion exists as to how to choose amongst available methods for analyzing data with competing events and how to interpret effect estimates. This confusion can be alleviated by understanding that the choice to define a competing event as a censoring event or not corresponds to a choice between different causal estimands. In this paper, we describe the assumptions required to identify those causal estimands and provide a mapping between such estimands and standard terminology from the statistical literature---in particular, the terms subdistribution function, subdistribution hazard and cause-specific hazard. We show that when the censoring process depends on measured time-varying risk factors, conventional statistical methods for competing events are not valid and alternative methods derived from Robins's g-formula may recover the causal estimand of interest.
研究の動機と目的
- 統計文献における、競合事象を打ち切りとして扱うべきかどうか、そしてなぜそうすべきかについての混乱を解消すること。
- 競合リスクを伴う故障時間解析における効果推定の因果的解釈を明確にすること。
- 標準的な統計用語(サブダイレクトハザード、コーズスペシフィックハザード、サブダイレクト関数)を、それぞれ異なる因果推定量にマッピングすること。
- 打ち切りプロセスが時間に依存するリスク要因に依存する場合、従来の競合リスク手法が因果推論において無効であることを示すこと。
- このような依存性がある状況下で因果効果を推定する有効な代替手段として、ロビンズのg-フォーミュラを提唱すること。
提案手法
- 論文は、競合事象を打ち切りとして扱うか否かに応じて、2つの異なる因果推定量を特定する。
- 特に時間に依存する交絡要因がある状況下で、各因果推定量を同定するための仮定を形式化する。
- 因果推定量を標準的な統計用語と結びつける:サブダイレクトハザードは、競合事象を打ち切りとしない推定量に対応し、コーズスペシフィックハザードは、それらを打ち切りとする推定量に対応する。
- 従来の競合リスク手法(例:サブダイレクトハザード回帰)が有効な因果推定を提供する条件を導出する。
- 打ち切りが測定可能な時間に依存するリスク要因に依存する場合、ロビンズのg-フォーミュラを用いて因果効果を推定する。
- 関心のある因果推定量と打ち切りプロセスの性質に基づいて、適切な手法を選択するためのフレームワークを提供する。
実験結果
リサーチクエスチョン
- RQ1生存分析において競合事象を打ち切り事象として定義した場合、どの因果推定量が推定されるか?
- RQ2サブダイレクトハザードとコーズスペシフィックハザードは、どのように異なる因果推定量に対応するか?
- RQ3従来の競合リスク手法が因果推論において無効となる条件は何か?
- RQ4打ち切りが時間に依存する交絡要因に依存する場合、ロビンズのg-フォーミュラはどのようにして因果効果を推定するか?
- RQ5時間依存の競合リスクが存在する状況で、因果効果を同定するためにはどのような仮定が必要か?
主な発見
- 競合事象を打ち切り事象として定義することは、一般の因果効果ではなく、特定の因果推定量を推定することに対応する。
- サブダイレクトハザードは、競合事象を打ち切りとしない因果推定量に対応するが、コーズスペシフィックハザードは、それらを打ち切りとする推定量に対応する。
- 打ち切りプロセスが時間に依存するリスク要因に依存する場合、従来の競合リスク手法は無効である。
- ロビンズのg-フォーミュラは、このような依存性がある状況下でも正しい因果推定量を回復でき、標準的手法の有効な代替手段を提供する。
- 推定量と手法の選択は、データの因果構造に関する実務的知識によって導かれるべきである。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。