[論文レビュー] BETS: The dangers of selection bias in early analyses of the coronavirus disease (COVID-19) pandemic
本稿では、発症開始時刻、暴露開始時刻、暴露終了時刻、感染時刻の4つの主要な疫学的イベントをモデル化することで、初期の新型コロナウイルス感染症研究における選択バイアスを是正する生成モデルBETSを紹介する。378例の武漢発出願例を用いて、初期の流行倍増時間の推定値が著しくバイアスを受けていたことを示し、真の倍増時間は常に2〜2.5日間であると判明した。また、約5%の症状性症例が14日を過ぎてから発症する可能性があり、男性は女性よりも発症が早いことが判明した。
The coronavirus disease 2019 (COVID-19) has quickly grown from a regional outbreak in Wuhan, China to a global pandemic. Early estimates of the epidemic growth and incubation period of COVID-19 may have been biased due to sample selection. Using detailed case reports from 14 locations in and outside mainland China, we obtained 378 Wuhan-exported cases who left Wuhan before an abrupt travel quarantine. We developed a generative model we call BETS for four key epidemiological events---Beginning of exposure, End of exposure, time of Transmission, and time of Symptom onset (BETS)---and derived explicit formulas to correct for the sample selection. We gave a detailed illustration of why some early and highly influential analyses of the COVID-19 pandemic were severely biased. All our analyses, regardless of which subsample and model were being used, point to an epidemic doubling time of 2 to 2.5 days during the early outbreak in Wuhan. A Bayesian nonparametric analysis further suggests that about 5% of the symptomatic cases may not develop symptoms within 14 days of infection and that men may be much more likely than women to develop symptoms within 2 days of infection.
研究の動機と目的
- 初期の、疫学的成長と潜伏期間を推定する影響力のある研究における選択バイアスを特定・是正すること。
- 武漢からの輸出症例のサンプリングメカニズムを明示的に考慮する生成モデル(BETS)を開発すること。
- 選択バイアスが主要な疫学的パラメータに与える影響を定量化するための形式的統計枠組みを提供すること。
- 武漢発出願症例の代表的サンプルを用いて、初期の倍増時間および潜伏期間の推定値を再評価すること。
- 性別による潜伏期間の差異を調査し、サンプリングバイアスによる長期間潜伏の低減推定の可能性を検討すること。
提案手法
- 曝露開始時刻、曝露終了時刻、感染時刻、発症時刻の4つの主要なイベントをモデル化する生成モデル(BETS)を開発した。
- 最初の原則から明示的な尤度関数を導出し、初期症例データにおけるサンプル選択バイアスを是正した。
- 旅行制限のタイミングによるバイアスを避けるために、旅行制限の前に出国した378例の武漢発出願症例のデータセットを用いた。
- パラメトリックな形を仮定しない非パラメトリックなベイズ法を用いて、潜伏期間分布を推定した。
- 複数のサブサンプルおよびモデル仮定に対して感度分析を実施し、結果の頑健性を確認した。
- モーメント生成関数を用いて、流行増加率と基本再生産数R0を結びつけたが、連続間隔推定における制限を認識した。
実験結果
リサーチクエスチョン
- RQ1初期症例データにおける選択バイアスが、新型コロナウイルス感染症の流行倍増時間の推定値をどの程度歪めているか?
- RQ2輸出症例からのサンプリングによって、新型コロナウイルス感染症の潜伏期間分布がどの程度低く見積もられているか?
- RQ3性別による潜伏期間の差異はあり、それが早期発見および感染拡大にどのように影響するか?
- RQ4BETSのような生成モデルは、輸出症例データのみを用いて初期パンデミックデータにおける選択バイアスを是正できるか?
- RQ5潜伏期間の真の尾部挙動は何か?現在の推定値は長期間潜伏症例をどの程度低く見積もっているか?
主な発見
- 武漢における初期流行期の流行倍増時間は、常に2〜2.5日間と推定されたが、以前の研究では6〜7日間と報告されていた。
- 異なるサブサンプルおよびモデルを用いたすべての分析が、2〜2.5日間の倍増時間に収束しており、モデル仮定に頼らずに安定していることが示された。
- ベイズ非パラメトリック分析により、約5%の症状性症例が感染後少なくとも14日後に発症する可能性があると示された。これは、97.5%の症例が11.5日以内に発症するとする仮定に反する。
- 男性は女性よりも感染後2日以内に発症する可能性が有意に高く、男性の発症が速いことが示された。
- 初期研究で用いられたパラメトリックモデルは、潜伏期間分布の尾部を低く見積もっており、過剰に楽観的な隔離期間をもたらした可能性がある。
- 初期研究における選択バイアス、特に輸入症例からのバイアスにより、流行増加速度および潜伏期間のばらつきが著しく低く見積もられていた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。