[論文レビュー] Weights and Methodology Brief for the COVID-19 Symptom Survey by University of Maryland and Carnegie Mellon University, in Partnership with Facebook
この論文は、Facebookの US CMU および世界の UMD の COVID-19 症状調査を代表的にするために使用されるサンプリング設計と2段階のウェイト付け手法(IPSWとポストストラティフィケーション)およびプライバシー保護を概説します。
Facebook is partnering with academic institutions to support COVID-19 research. Currently, we are inviting Facebook app users in the United States to take a survey collected by faculty at Carnegie Mellon University (CMU) Delphi Research Center, and we are inviting Facebook app users in more than 200 countries or territories globally to take a survey collected by faculty at the University of Maryland (UMD) Joint Program in Survey Methodology (JPSM). As part of this initiative, we are applying best practices from survey statistics to design and execute two components: (1) sampling design and (2) survey weights, which make the sample more representative of the general population. This paper describes the methods we used in these efforts in order to allow data users to execute their analyses using the weights.
研究の動機と目的
- Facebook の COVID-19 症状調査のサンプリング設計と対象集団を説明する。
- 非回答とカバレッジ誤差を減らすための2段階のウェイト付け手法を説明する。
- 研究者向けのプライバシー保護慣行とデータアクセスを明確にする。
- 分析と分散推定における調査ウェイトの使用ガイドラインを提供する。
提案手法
- サンプリングフレームを Facebook Active User Base (FAUB) の 18 歳以上を対象とし、200 以上の国/地域に跨るものとして定義する。
- 管理境界をまたぐ層別ランダム抽出と日次の繰り返し横断調査を用いる。
- 非回答を調整するために、Facebook由来の共変量を用いてInverse Propensity Score Weighting (IPSW) を適用する。
- 連続共変量を分布に合わせてビン化し、正則化とウェイトトリミングを適用する。
- ベンチマーク(US CPS 2018; UN 2019 projections)とIPSW入力を用いたPost-Stratification (PS) を適用し、一般的な成人集団を代表させる。
- CLI 推定用と少なくとも2つの質問に回答するより大きなセット用の2つのウェイトを提供し、分散推定のガイダンスを提供する。」],
- research_questions':['IPSWベースの非回答調整は Facebook Active User Base をどの程度上手く表現しているか。','国別または地域レベルの人口ベンチマークに対して調査ウェイトを整合させるPSの有効性はどの程度か。','母集団およびサブ集団推定、分散推定を含むウェイトの使用に関するガイダンスは何か。','ウェイトプロセスと研究者のデータアクセスに伴うプライバシー保護慣行は何か。'],
- key_findings':['ウェイトは2段階で生成される:非回答調整のためのIPSWとカバレッジ調整のためのポストストラティフィケーション。','非回答の共変量は内部のFacebookデータから取得され、年齢、性別、地理を含む。ウェイトは回答者が母集団の何人の成人を表すかを反映する。','最終ウェイトはポストストラタフィケーションに行政区が含まれる場合は地域レベルまたは国レベルの統計を可能にする。そうでなければ国レベルの統計が適用される。','ウェイトは研究者が扱いやすいように単純・頑健・簡便になるよう設計され、利用者によるさらなるバイアス補正の選択肢がある。','Aggregated weighted estimates are publicly available through UMD and CMU; non-aggregated data access requires Data Use Agreement.','Early US weights were adjusted post hoc due to prior scaling decisions; users with older weights are advised to adopt new weights.'],
- table_headers:[],
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。