QUICK REVIEW

[论文解读] Cost-Aware Optimized Front-Door Experimental Design

Leopold Mareis, Mathias Drton|arXiv (Cornell University)|Mar 23, 2026

Advanced Causal Inference Techniques被引用 0

一句话总结

该论文推导了具有未观测混杂的多变量线性前门模型的有效影响函数，并提出了在预算约束下最小化渐近方差的成本感知最优采样设计，相较于简单的全量采样，效率提升约5.3%至31.9%。

ABSTRACT

Causal effect estimation often succeeds cost-constrained sequential data collection. This work considers multivariate linear front-door models with arbitrary unobserved confounding on treatment and response. We optimize the experimental design by balancing the statistical efficiency and measurement costs through partial data. The full-data efficient influence function for the causal effect is derived, together with the geometry of all observed-data influence functions. This characterization yields a closed-form optimal sampling policy and an estimator to minimize the asymptotic variance of regular asymptotically linear (RAL) estimators within a class of augmented full-data influence functions. The resulting design also covers back-door estimation. In simulations and applications to biological, medical, and industrial datasets, the optimized designs achieve substantial efficiency gains ($5.3\%$ to $31.9\%$) over naive full-sampling strategies.

研究动机与目标

在多变量线性前门模型中，受到未观测混杂影响下的因果效应估计的成本约束动机。
推导因果效应的全数据有效影响函数并刻画观测数据影响函数。
提出一个闭式的最优采样策略（倾向性），在固定预算下最小化渐近方差。
在增强的全数据影响函数框架内提供一个实现成本高效推断的估计量。
通过仿真和真实数据集展示在回门估计中的实际改进与适用性。

提出的方法

定义一个多变量线性前门模型，其观测的简并/缺失由倾向性函数 pi_1 和 pi_2 控制。
计算因果效应 xi 的有效全数据影响函数，并将其分解为针对 beta_Mt 与 beta_rM 的两个分量。
刻画观测数据影响函数的几何结构，并推导 pi 的闭式最优增强影响函数（定理4.6）。
推导成本约束优化以获得在预算 b_0 下最小化渐近方差的最优采样策略 pi*（定理4.6、推论4.7）。
给出一个在采样设计下通过求解 beta_Mt 与 beta_rM 的估计方程来构建的优化观测数据估计量 hat xi_n。
在仿真和来自生物、医学与工业的数据集上，优化设计在全量采样基础上实现5.3%至31.9%的效率提升。

实验结果

研究问题

RQ1在有限测量预算下，如何在前门设置中最小化因果效应估计量的渐近方差？
RQ2在多阶段观测过程中，平衡信息增益与测量成本的最优采样策略形式为何？
RQ3在成本约束下，观测数据影响函数的增强行为如何用于构造成本高效的估计量？
RQ4在同一成本感知前门设计框架下，回门估计是否也能作为推论的推论（推论同质性）？
RQ5部分测量设计在现实世界的生物、医学和工业数据集上是否能显著提高效率？

主要发现

推导出因果效应 xi 的有效全数据影响函数，并将其分解为针对 beta_Mt 与 beta_rM 的两个正交分量。
识别出一个闭式的最优观测数据影响函数增强，给出在固定预算下最小化渐近方差的最优采样策略 pi*。
最优策略在中间估计量的精度与测量成本之间取得平衡，并给出在何时对 X_M 与 X_r 进行采样的指引。
优化后的估计量 hat xi_n 使用 beta_Mt 与 beta_rM 的增强估计量，在预算约束下相较于全量数据收集实现更低的渐近方差。
推论表明优化设计同样适用于回门估计，具有类似的采样决策结构。
在来自生物、医学与工业的仿真与数据集上，效率提升范围为相较于简单全量采样的5.3%至31.9%。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。