Skip to main content
QUICK REVIEW

[論文レビュー] K-Adaptive Partitioning for Survival Data: The kaps Add-on Package for R

Soo‐Heang Eo, Seung‐Mo Hong|arXiv (Cornell University)|Jun 19, 2013
Bayesian Methods and Mixture Models参考文献 9被引用数 8
ひとこと要約

本論文では、kaps Rパッケージを用いて生存データに対するK適応的分割を提案し、事前にグループ数(K)を指定せずに、異質な生存群を特定する最適な多項分割を可能にする。再サンプリング手法を用いてKを特定し、ログランク統計量を用いた再帰的分割を組み合わせることで、生存解析における予後群の同定を向上させる。結腸直腸がんデータを用いて実証された。

ABSTRACT

The partitioning of an ordered prognostic factor is important in order to obtain several groups having heterogeneous survivals in medical research. For this purpose, a binary split has often been used once or recursively. We propose the use of a multi-way split in order to afford an optimal set of cut-off points. In practice, the number of groups (K) may not be specified in advance. Thus, we also suggest finding an optimal K by a resampling technique. The algorithm was implemented into an R package that we called kaps, which can be used conveniently and freely. It was illustrated with a toy dataset, and was also applied to a real data set of colorectal cancer cases from the Surveillance Epidemiology and End Results.

研究の動機と目的

  • 生存データの分割において、二項または再帰的二項分割の限界を克服するため。
  • 事前にKを指定する必要のない、最適な予後群の数(K)を特定する手法を開発するため。
  • 予後因子に基づく多項分割を用いて、臨床的に意味のある生存サブグループの同定を改善するため。
  • 実用的な医療研究への応用を可能にするために、自由に利用可能なRパッケージ(kaps)としてこの手法を実装するため。
  • SEERから得た結腸直腸がんの実世界データを用いて、アプローチを検証するため。

提案手法

  • 順序付き予後因子をK個のグループに多項分割し、生存結果が最大限に異質になるようにする。
  • 分割の過程で、グループ間の生存分布の同質性を評価するためにログランク検定統計量を用いる。
  • 予測誤差を最小化するように、再サンプリング手法(例:交差検証またはパーミュテーション)を用いて最適なグループ数(K)を選択する。
  • K適応的選択を組み込んだ再帰的分割を実装し、再サンプリングの性能に基づいてKを段階的に決定する。
  • ユーザーが生存解析で簡単に利用できるように、kapsという名前のRパッケージにアルゴリズムを統合する。
  • 生存差を最大限に高めるカットオフ点を特定するために、グリーディー探索戦略を用いる。

実験結果

リサーチクエスチョン

  • RQ1多項分割は、従来の二項分割と比較して、生存データにおける予後サブグループの同定を改善できるか?
  • RQ2事前に指定せずに、最適なグループ数(K)を自動的に特定する方法は何か?
  • RQ3提案されたK適応的分割法は、標準的手法と比較して、より臨床的に意味のあるおよび統計的に有意な生存グループを生成できるか?
  • RQ4kapsパッケージの性能は、SEERの実世界の生存データ(例:結腸直腸がん)に対してどのように評価できるか?
  • RQ5再サンプリングに基づくK選択は、得られる生存グループの安定性および予測精度にどのような影響を与えるか?

主な発見

  • K適応的分割法は、単一の予後因子を用いて、有意に異なる生存結果を示す複数の生存群を効果的に同定した。
  • Kの再サンプリングに基づく選択は、固定Kアプローチと比較して、モデルの安定性を向上させ、過学習を低減した。
  • kaps Rパッケージは、実際の生存解析において多項分割を効率的かつ再現可能に実装できる。
  • 結腸直腸がんデータセットにおいて、標準的な二項再帰的分割法よりも、臨床的に意味のあるサブグループをより効果的に同定した。
  • 実データを用いた検証により、Kグループ間の生存差を最大限に高める最適なカットオフ点を効果的に同定できることが示された。
  • このアプローチは、シミュレーションデータおよび実世界の生存データの両方の設定において、頑健性と実用的有用性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。