[論文レビュー] Survival analysis for AdVerse events with VarYing follow-up times (SAVVY) -- comparison of adverse event risks in randomized controlled trials
本稿では、変動するフォローアップ期間、打ち切り、および競合事象(CE)を考慮した生存手法を用いることで、無作為化比較試験(RCT)における有害事象(AE)リスク比較を改善するSAVVYフレームワークを提案する。AE確率推定におけるゴールドスタンダードはAalen-Johansen推定器であり、相対リスク(RR)推定におけるバイアスに最も影響するのは推定器の選択であり、データ特性よりも重要であることが示された。
Analyses of adverse events (AEs) are an important aspect of the evaluation of experimental therapies. The SAVVY (Survival analysis for AdVerse events with Varying follow-up times) project aims to improve the analyses of AE data in clinical trials through the use of survival techniques appropriately dealing with varying follow-up times, censoring, and competing events (CE). In an empirical study including seventeen randomized clinical trials the effect of varying follow-up times, censoring, and competing events on comparisons of two treatment arms with respect to AE risks is investigated. The comparisons of relative risks (RR) of standard probability-based estimators to the gold-standard Aalen-Johansen estimator or hazard-based estimators to an estimated hazard ratio (HR) from Cox regression are done descriptively, with graphical displays, and using a random effects meta-analysis on AE level. The influence of different factors on the size of the bias is investigated in a meta-regression. We find that for both, avoiding bias and categorization of evidence with respect to treatment effect on AE risk into categories, the choice of the estimator is key and more important than features of the underlying data such as percentage of censoring, CEs, amount of follow-up, or value of the gold-standard RR. There is an urgent need to improve the guidelines of reporting AEs so that incidence proportions are finally replaced by the Aalen-Johansen estimator - rather than by Kaplan-Meier - with appropriate definition of CEs. For RRs based on hazards, the HR based on Cox regression has better properties than the ratio of incidence densities.
研究の動機と目的
- フォローアップ期間のばらつき、打ち切り、または競合事象(CE)が存在する際の、RCTにおける有害事象(AE)リスク比較のための適切な統計的手法の欠如に対処すること。
- 標準推定器(例:発生率割合、一 minus カプラン=マイヤー、発生密度)とゴールドスタンダードであるAalen-Johansen推定器との比較を通じて、治療群間の相対リスク(RR)推定のパフォーマンスを評価すること。
- 複雑な生存データ構造下で、ハザードベース推定器(例:コックス比例ハザード回帰のハザード比)が発生密度比を上回るRR推定性能を有するかどうかを調査すること。
- Aalen-Johansen推定器を発生率割合やカプラン=マイヤー推定器よりも優先して使用することを提言することで、臨床試験報告ガイドラインの改善を支援すること。
- 打ち切り率、CEの有病率、フォローアップ期間といったデータ特徴が、ゴールドスタンダードとの比較においてRR推定のバイアスに与える影響を評価すること。
提案手法
- 多様な疾患適応症およびAEタイプを有する17件の無作為化臨床試験の実証的分析。
- AE確率のための6つの推定器の比較:発生率割合、一 minus カプラン=マイヤー、発生密度、および3種類のAalen-Johansenベース推定器(CE特異的ハザードを含む)。
- ハザードベースRR推定のベンチマークとして、コックス比例ハザード回帰からのハザード比(HR)の使用。
- AEタイプごとのランダム効果メタアナリシスを用いて、Aalen-Johansen推定器との相対的な推定器パフォーマンスとバイアスを要約すること。
- データレベル要因(例:打ち切り率、CE有病率、フォローアップ期間)がRR推定バイアスに与える影響を定量化するためのメタ回帰分析。
- すべての推定器を計算するために公開済みのコード(GitHub)を活用し、再現性を確保するためHTML形式で出力を共有すること。
実験結果
リサーチクエスチョン
- RQ1フォローアップ期間がばらつき、競合事象が存在する状況下で、推定器の選択が相対リスク(RR)推定におけるバイアスにどのように影響するか?
- RQ2発生率割合や一 minus カプラン=マイヤーといった標準推定器は、Aalen-Johansen推定器と比較して、RRをどれほど過小または過大に推定するか?
- RQ3競合事象が存在する状況下で、コックス回帰からのハザード比は、発生密度比に比べてより正確なRR推定を提供するか?
- RQ4打ち切り率、競合事象の割合、フォローアップ期間といったデータレベル要因が、RR推定バイアスの大きさにどのように影響するか?
- RQ5Aalen-Johansen推定器は、打ち切り、変動するフォローアップ期間、および競合事象を適切に扱う点で、他の非パラメトリック手法に比べて優れているか?
主な発見
- Aalen-Johansen推定器は、変動するフォローアップ期間、打ち切り、および競合事象を同時に扱える唯一の非パラメトリック手法であり、AE確率推定におけるゴールドスタンダードである。
- 競合事象が存在する場合、一 minus カプラン=マイヤー推定器は累積AE確率を過大に推定し、そのバイアスはRR推定にまで伝播する。その結果、治療群によっては過大または過小推定が生じる。
- 推定器の選択が、打ち切り率、CE有病率、フォローアップ期間といったデータレベル特徴よりも、RR推定バイアスに大きな影響を与える。
- 特に競合事象が存在する状況下では、ハザード比(HR)は発生密度比に比べてより優れた統計的性質を示す。
- リスクベネフィット評価の正確性を高めるために、臨床試験報告および製品ラベルにおいて、発生率割合や一 minus カプラン=マイヤー推定器の代わりにAalen-Johansen推定器を採用すべきである。
- AE報告ガイドラインは、Aalen-Johansen推定器の使用を明確に推奨するとともに、CE特異的ハザード推定値の含めることで、堅牢なリスク評価を支援すべきである。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。