Skip to main content
QUICK REVIEW

[論文レビュー] A New Approach to Hierarchical Data Analysis: Targeted Maximum Likelihood Estimation of Cluster-Based Effects Under Interference

Laura B. Balzer, Wenjing Zheng|arXiv (Cornell University)|Jun 8, 2017
Advanced Causal Inference Techniques被引用数 2
ひとこと要約

本稿では、干渉が存在する状況下でクラスターレベルの曝撃効果を推定するための2つの標的最大尤度推定法(TMLE)を提案する。個々の結果が共有されるクラスターファクターや社会的・生物学的相互作用によって相関している場合を想定する。最初の推定法は非パラメトリックモデルを用いて、任意の干渉を許容する。第二の推定法は、クラスターレベルおよび個人レベルの共変量が交絡を制御するために十分であると仮定する。シミュレーションの結果、サブモデルを仮定することでバイアスが生じる可能性があることが示され、推定段階で作業仮定を組み込むことの利点が浮き彫りになった。

ABSTRACT

We often seek to estimate the impact of an exposure naturally occurring or randomly assigned at the cluster-level. For example, the literature on neighborhood determinants of health continues to grow. Likewise, community randomized trials are applied to learn about real-world implementation, sustainability, and population effects of interventions with proven individual-level efficacy. In these settings, individual-level outcomes are correlated due to shared cluster-level factors, including the exposure, as well as social or biological interactions between individuals. To flexibly and efficiently estimate the effect of a cluster-level exposure, we present two targeted maximum likelihood estimators (TMLEs). The first TMLE is developed under a non-parametric causal model, which allows for arbitrary interactions between individuals within a cluster. These interactions include direct transmission of the outcome (i.e. contagion) and influence of one individual's covariates on another's outcome (i.e. covariate interference). The second TMLE is developed under a causal sub-model assuming the cluster-level and individual-specific covariates are sufficient to control for confounding. Simulations compare the alternative estimators and illustrate the potential gains from pairing individual-level risk factors and outcomes during estimation, while avoiding unwarranted assumptions. Our results suggest that estimation under the sub-model can result in bias and misleading inference in an observational setting. Incorporating working assumptions during estimation is more robust than assuming they hold in the underlying causal model. We illustrate our approach with an application to HIV prevention and treatment.

研究の動機と目的

  • 個々の結果が伝染や共変量干渉などの干渉によって相関する場合に、クラスターレベルの曝撃効果を推定する課題に対処すること。
  • クラスタ内での任意の相互作用を許容するが、制限的なパラメトリック仮定を必要としない、柔軟な非パラメトリックTMLEの開発。
  • クラスターレベルおよび個人レベルの共変量が交絡を制御するために十分であると仮定するサブモデルに基づくTMLEの性能評価。
  • 異なるデータ生成メカニズム下での2つの推定法の頑健性および効率性の比較。
  • HIV予防・治療への応用を通じて、本手法の実用的有用性の提示。

提案手法

  • クラスタ内での任意の干渉(直接伝播や共変量干渉を含む)を許容するが、結果のメカニズムを柔軟にモデル化する非パラメトリックTMLEを構築。
  • 因果サブモデルを仮定し、クラスターレベルおよび個人特有の共変量が交絡を制御するために十分であると仮定する第二のTMLEを構築。
  • 実証的尤度に基づく推定を用いて、目的のパラメータをターゲット化し、二重ロバスト性と効率性を確保。
  • ターゲット最小損失に基づく推定(TMLE)の原則に従い、初期の結果および処置メカニズムの推定値を、バイアスを最小限に抑えるように更新。
  • インフルエンスカーブに基づく推論を組み込み、妥当な信頼区間および仮説検定を可能にする。
  • 推定法の性能を比較するため、干渉の有無や交絡の程度が異なるさまざまな設定でシミュレーションを実施。

実験結果

リサーチクエスチョン

  • RQ1干渉がクラスターレベルのデータに存在する場合、非パラメトリックTMLEとサブモデルに基づくTMLEの性能はどのように比較されるか?
  • RQ2交絡制御のためのサブモデルを仮定することが、観察的研究における推定バイアスに与える影響は何か?
  • RQ3推定段階で交絡に関する作業仮定を組み込むことで、因果モデルにそれらが成り立つと仮定するよりも、推定の頑健性が向上するか?
  • RQ4干渉が存在する状況下で、個人レベルのリスク要因および結果が推定の効率性に与える影響は何か?
  • RQ5特にHIV予防などの公衆衛生的応用において、干渉を無視するとどのような影響が生じるか?

主な発見

  • サブモデルに基づくTMLEは、仮定された交絡制御が誤っている場合でさえ、モデルが正しく指定されていても、バイアスを生じる可能性がある。
  • 測定されていない、または不適切にモデル化された干渉が存在する場合、サブモデルに基づく推定は誤った推論をもたらす。
  • 推定段階で交絡に関する作業仮定を組み込むことは、因果モデルにそれらが成り立つと仮定するよりも、より頑健である。
  • 非パラメトリックTMLEはより弱い仮定の下でも有効な推論を提供し、干渉メカニズムが複雑であったり未知であったりしても良好に機能する。
  • シミュレーションの結果、推定段階で個人レベルのリスク要因と結果を併用することで、効率性が向上し、バイアスが低減することが示された。
  • HIV予防・治療への応用から、本手法が干渉パターンが複雑な現実の公衆衛生的状況においても関連性があることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。