[论文解读] Semiparametric Regression Analysis of Interval-Censored Competing Risks Data
本文提出了一种用于区间删失竞争风险数据的半参数回归模型,采用灵活的子分布风险框架,可处理时变协变量和任意检查时间表。该研究提出了一种稳定的EM型算法用于非参数最大似然估计,建立了估计量的一致性、渐近正态性和半参数效率,并在模拟研究和人类免疫缺陷病毒-1(HIV-1)病毒亚型的应用中表现出色。
Interval-censored competing risks data arise when each study subject may experience an event or failure from one of several causes and the failure time is not observed directly but rather is known to lie in an interval between two examinations. We formulate the effects of possibly time-varying (external) covariates on the cumulative incidence or sub-distribution function of competing risks (i.e., the marginal probability of failure from a specific cause) through a broad class of semiparametric regression models that captures both proportional and non-proportional hazards structures for the sub-distribution. We allow each subject to have an arbitrary number of examinations and accommodate missing information on the cause of failure. We consider nonparametric maximum likelihood estimation and devise a fast and stable EM-type algorithm for its computation. We then establish the consistency, asymptotic normality, and semiparametric efficiency of the resulting estimators for the regression parameters by appealing to modern empirical process theory. In addition, we show through extensive simulation studies that the proposed methods perform well in realistic situations. Finally, we provide an application to a study on HIV-1 infection with different viral subtypes.
研究动机与目标
- 建模时变协变量对区间删失数据中竞争风险累积发病率的影响。
- 处理数据中任意数量的受试者检查以及缺失的致死原因信息。
- 为这些复杂数据结构下的半参数模型开发一种计算高效且稳定的估计程序。
- 利用经验过程理论建立估计量的理论性质,如一致性、渐近正态性和半参数效率。
提出的方法
- 构建了一类广义的半参数模型,能够捕捉竞争风险的成比例与非成比例子分布风险。
- 使用非参数最大似然估计(NPML)来估计基线子分布风险和回归参数。
- 开发了一种EM型算法,通过迭代更新回归系数和基线累积风险的估计,确保数值稳定性。
- 应用现代经验过程理论,推导估计量的渐近分布性质。
- 通过将失败时间建模为位于检查区间内来处理区间删失,同时允许缺失致死原因信息。
- 通过在子分布风险模型中引入灵活的链接函数,整合时变协变量。
实验结果
研究问题
- RQ1在存在区间删失竞争风险数据的情况下,如何灵活地建模时变协变量?
- RQ2在处理任意检查时间表和缺失致死原因信息时,何种估计方法能确保计算稳定性和效率?
- RQ3在半参数建模下,所提出估计量的理论性质(一致性、渐近正态性、效率)是什么?
- RQ4在现实数据配置下,所提出方法在有限样本中的表现如何?
主要发现
- 所提出的NPML估计的EM型算法快速且数值稳定,可实现对复杂区间删失数据的实际应用。
- 回归参数的估计量具有一致性和渐近正态性,其方差-协方差矩阵在正则条件下达到半参数效率。
- 模拟研究显示,即使在高比例区间删失和缺失致死原因信息的情况下,估计性能依然良好。
- 该方法能有效捕捉子分布风险中的成比例与非成比例风险结构,提供更大的建模灵活性。
- 在HIV-1应用中,模型揭示了病毒亚型对疾病进展累积发病率的显著影响,同时调整了时变病毒载量的影响。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。