Skip to main content
QUICK REVIEW

[論文レビュー] A Weighting Framework for Clusters as Confounders in Observational Studies

Eli Ben‐Michael, Avi Feller|arXiv (Cornell University)|Feb 4, 2026
Advanced Causal Inference Techniques被引用数 0
ひとこと要約

この論文は、クラスタ構造データの全体的および局所的バランスの両方を扱う統一的重み付けフレームワークを開発し、階層的バランシング重みと Mundlak バランシング重みを導入して、シミュレーションと二つの経験的適用を通じて既存の手法と比較します。

ABSTRACT

When units in observational studies are clustered in groups, such as students in schools or patients in hospitals, researchers often address confounding by adjusting for cluster-level covariates or cluster membership. In this paper, we develop a unified weighting framework that clarifies how different estimation methods control two distinct sources of imbalance: global balance (differences between treated and control units across clusters) and local balance (differences within clusters). We show that inverse propensity score weighting (IPW) with a random effects propensity score model -- the current standard in the literature -- targets only global balance and constant level shifts across clusters, but imposes no constraints on local balance. We then present two approaches that target both forms of balance. First, hierarchical balancing weights directly control global and local balance through a constrained optimization problem. Second, building on the recently proposed Generalized Mundlak approach, we develop a novel Mundlak balancing weights estimator that adjusts for cluster-level sufficient statistics rather than cluster indicators; this approach can accommodate small clusters where all units are treated or untreated. Critically, these approaches rest on different assumptions: hierarchical balancing weights require only that treatment is ignorable given covariates and cluster membership, while Mundlak methods additionally require an exponential family structure. We then compare these methods in a simulation study and in two applications in education and health services research that exhibit very different cluster structures.

研究の動機と目的

  • クラスタ構造データが治療割当の全体的および局所的な不均衡を生じさせる機序を明確化する。
  • 全体的および局所的なバランスを同時に狙う重み付け手法を開発する。
  • 階層的バランシング重みと Mundlak バランシング重みを導入・形式化する。
  • シミュレーションとクラスタ構造の異なる二つの実証的一例を通じて手法を比較する。

提案手法

  • バランスの偏りを全体的成分と局所的成分に分解してバランスの目標を動機づける。
  • アウトカムモデルをクラスタ固有効果とともに表現する線形-φ(x) フレームワークを採用する。
  • 制約付き最適化を通じて全体的および局所的なバランスを強制する階層的バランシング重みを提案する。
  • 指数族仮定の下でクラスタレベルの十分 Statistics に条件付ける Mundlak バランシング重みを導入する。
  • Mundlak 手法の前提として、共変量とクラスタ所属を条件付けた治療の ignorability(Assumption 2)と Mundlak 手法の指数族クラスタ ignorability(Assumption 3)を議論する。
  • 教育(小規模クラスタ)と保健サービス(大規模クラスタ)という文脈で手法をシミュレーションと実証適用で比較する。
Figure 1 : Bias and Root Mean Square Error of balancing weights, IPW based on a random intercept model, hierarchical balancing weights, and Mundlak weights, varying the degree of cluster confounding.
Figure 1 : Bias and Root Mean Square Error of balancing weights, IPW based on a random intercept model, hierarchical balancing weights, and Mundlak weights, varying the degree of cluster confounding.

実験結果

リサーチクエスチョン

  • RQ1クラスタ所属を調整する際、全体的および局所的なバランスをどのように達成できるか?
  • RQ2階層的バランシング重みと Mundlak ベースのアプローチのトレードオフと実現可能性は、異なるクラスタ構造でどう変わるか?
  • RQ3 Mundlak ベースの手法はクラスタ化データ内の ATT をどのような前提の下で特定でき、その前提は実務にどう影響するか?

主な発見

  • ランダム切片 IPW は全体的なバランスを対象とするが局所的なバランスを無視する。
  • 階層的バランシング重みは全体的および局所的なバランスの同時達成を可能にする一方で、データの希薄性からトレードオフが生じる。
  • Mundlak バランシング重みはクラスタレベルの十分 Statistics を条件付けることによりクラスタ調整を一般化し、指数族構造を必要とする。
  • 小規模クラスタは課題を生じ、別のターゲティングや前提が必要となる可能性がある;一方 Mundlak 手法はより強いモデリング仮定の下で小クラスタを活用する方法を提供する。
  • シミュレーションと二つの実証適用は、バランス目標とクラスタ構造が手法選択を左右することを示す。
Figure 2 : Balance metrics for three cluster adjustment methods in the education application.
Figure 2 : Balance metrics for three cluster adjustment methods in the education application.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。