[论文解读] Weights and Methodology Brief for the COVID-19 Symptom Survey by University of Maryland and Carnegie Mellon University, in Partnership with Facebook
本文概述了用于使 Facebook 的美国 CMU 和全球 UMD COVID-19 症状调查具有代表性的抽样设计和两阶段加权方法(IPSW 与事后分层),以及隐私保护。
Facebook is partnering with academic institutions to support COVID-19 research. Currently, we are inviting Facebook app users in the United States to take a survey collected by faculty at Carnegie Mellon University (CMU) Delphi Research Center, and we are inviting Facebook app users in more than 200 countries or territories globally to take a survey collected by faculty at the University of Maryland (UMD) Joint Program in Survey Methodology (JPSM). As part of this initiative, we are applying best practices from survey statistics to design and execute two components: (1) sampling design and (2) survey weights, which make the sample more representative of the general population. This paper describes the methods we used in these efforts in order to allow data users to execute their analyses using the weights.
研究动机与目标
- 解释 Facebook COVID-19 症状调查的抽样设计与目标人群。
- 描述 two-stage 加权方法以降低非应答和覆盖误差。
- 阐明对研究人员的隐私保护做法和数据访问。
- 提供在分析和方差估计中使用调查权重的指南。
提出的方法
- 将抽样框架定义为 Facebook Active User Base (FAUB),年龄 18+,覆盖 200+ 国家/地区。
- 使用日频重复横截面,分层随机抽样并在行政边界上进行差异抽样。
- 应用 Inverse Propensity Score Weighting (IPSW) 以使用 Facebook 衍生协变量调整非应答。
- 将连续协变量转换为区间以匹配分布,并应用正则化与权重截断。
- 使用基准值(US CPS 2018;UN 2019 投影)和 IPSW 输入应用 Post-Stratification (PS),以代表一般成年人口。
- 提供两组权重(用于 CLI 估计和回答至少两个问题的更大集)以及方差估计指南。
实验结果
研究问题
- RQ1基于 IPSW 的非应答调整在多大程度上代表 Facebook Active User Base?
- RQ2事后分层在使调查权重与国家级或区域级人口基准对齐方面有多有效?
- RQ3在总体和子人群估计以及方差估计中使用权重的指导是什么?
- RQ4在加权过程和研究人员数据访问中有哪些隐私保护做法?
主要发现
- 权重分两阶段生成:IPSW 用于非应答调整,Post-stratification 用于覆盖调整。
- 非应答协变量来自内部 Facebook 数据,包含年龄、性别和地理信息;权重反映一个应答者在总体中被代表的成人数量。
- 最终权重在将行政区域纳入事后分层时使区域或国家层面的统计成为可能;否则,适用于国家层面的统计。
- 权重设计为简单、鲁棒、研究人员易于使用,并提供用户进一步偏差校正的选项。
- 聚合后的加权估计可通过 UMD 和 CMU 公开获取;非聚合数据访问需要 Data Use Agreement。
- 早期美国权重因先前的缩放决策而事后调整;使用旧权重的用户建议采用新权重。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。