Skip to main content
QUICK REVIEW

[論文レビュー] Semiparametric Regression Analysis of Interval-Censored Competing Risks Data

Lu Mao, D. Y. Lin|arXiv (Cornell University)|Feb 4, 2016
Statistical Methods and Inference参考文献 15被引用数 2
ひとこと要約

本稿では、時間変動型共変量と任意の検査スケジュールを許容する柔軟な下位分布ハザード枠組みを用いて、区間センシングされた競合リスクデータのための半パラメトリック回帰モデルを提案する。非パラメトリック最尤推定(NPML)のための安定なEM型アルゴリズムを導入し、一貫性、漸近正規性、半パラメトリック効率性を確立した。シミュレーションとHIV-1ウイルス亜型への応用において優れた性能を示した。

ABSTRACT

Interval-censored competing risks data arise when each study subject may experience an event or failure from one of several causes and the failure time is not observed directly but rather is known to lie in an interval between two examinations. We formulate the effects of possibly time-varying (external) covariates on the cumulative incidence or sub-distribution function of competing risks (i.e., the marginal probability of failure from a specific cause) through a broad class of semiparametric regression models that captures both proportional and non-proportional hazards structures for the sub-distribution. We allow each subject to have an arbitrary number of examinations and accommodate missing information on the cause of failure. We consider nonparametric maximum likelihood estimation and devise a fast and stable EM-type algorithm for its computation. We then establish the consistency, asymptotic normality, and semiparametric efficiency of the resulting estimators for the regression parameters by appealing to modern empirical process theory. In addition, we show through extensive simulation studies that the proposed methods perform well in realistic situations. Finally, we provide an application to a study on HIV-1 infection with different viral subtypes.

研究の動機と目的

  • 故障時刻が区間センシングされている状況で、時間変動型共変量が競合リスクの累積発生に与える影響をモデル化すること。
  • データに任意の数の被験者検査と欠損した故障原因情報に対処すること。
  • これらの複雑なデータ構造下での半パラメトリックモデルの推定手順として、計算的に効率的かつ安定した手法を開発すること。
  • 経験過程理論を用いて、推定量の理論的性質(一貫性、漸近正規性、半パラメトリック効率性)を確立すること。

提案手法

  • 競合リスクにおける比例ハザードおよび非比例ハザードの両方を捉える広範な半パラメトリックモデルのクラスを定式化する。
  • ベースライン下位分布ハザードおよび回帰パラメータの推定に非パラメトリック最尤推定(NPML)を用いる。
  • 回帰係数とベースライン累積ハザードの推定値を繰り返し更新するEM型アルゴリズムを開発し、数値的安定性を確保する。
  • 現代の経験過程理論を応用して、推定量の漸近的分布的性質を導出する。
  • 故障時刻が検査区間内にあることとして区間センシングを扱い、故障原因情報の欠損に対応する。
  • 下位分布ハザードモデルにおける柔軟なリンク関数を用いて、時間変動型共変量を統合する。

実験結果

リサーチクエスチョン

  • RQ1区間センシングされた競合リスクデータの下で、時間変動型共変量を柔軟にモデル化する方法は何か?
  • RQ2任意の検査スケジュールと欠損した原因情報に対処する際、計算的安定性と効率性を保証する推定手法は何か?
  • RQ3半パラメトリックモデル下での推定量の理論的性質(一貫性、漸近正規性、効率性)は何か?
  • RQ4現実的なデータ構成下で、有限標本における提案手法の性能はどの程度か?

主な発見

  • NPML推定のための提案されたEM型アルゴリズムは、高速かつ数値的に安定しており、複雑な区間センシングデータへの実用的適用を可能にする。
  • 回帰パラメータの推定量は一貫性を示し、漸近的に正規分布に従い、正則性条件下で分散・共分散行列が半パラメトリック効率性に達する。
  • シミュレーション研究により、高い区間センシング度と故障原因情報の欠損が存在する状況でも、良好な有限標本性能が示された。
  • 提案手法は、下位分布ハザードにおける比例ハザードおよび非比例ハザード構造を両方とも的確に捉え、より高いモデリングの柔軟性を提供する。
  • HIV-1応用において、ウイルス亜型が疾患進行の累積発生に与える影響が明確に特定され、時間変動型ウイルス負荷を調整した上で明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。