[论文解读] Comparison of the Likelihood Ratios of Two Diagnostic Tests Subject to a Paired Design
本文提出六种置信区间(CI)方法——其中四种为新方法,两种为已有方法——用于在配对设计下比较两个二分类诊断试验的似然比(LRs),并提出一种样本量计算方法。通过模拟评估了覆盖概率和区间长度,结果表明Fieller区间和自助法区间表现最佳,其中Fieller方法在似然比估计中展现出更优的覆盖概率和精确度。
Positive and negative likelihood ratios are parameters which are used to assess and compare the effectiveness of binary diagnostic tests. Both parameters only depend on the sensitivity and specificity of the diagnostic test and are equivalent to a relative risk. This article studies the comparison of the likelihood ratios of two binary diagnostic tests subject to a paired design through confidence intervals. Six approximate confidence intervals are presented for the ratio of the likelihood ratios, and simulation experiments are carried out to study the coverage probabilities and the average lengths of the intervals considered, and some general rules of application are proposed. A method is also proposed to determine the sample size necessary to estimate the ratio between the likelihood ratios with a determined precision. The results were applied to two real examples.
研究动机与目标
- 开发并评估多种用于比较两个配对二分类诊断试验之间阳性与阴性似然比之比的置信区间方法。
- 提出一种样本量计算方法,以确保在估计似然比之比时达到期望的精确度。
- 解决在配对诊断研究设计中缺乏稳健且广泛适用的似然比之比置信区间的问题。
- 提供基于覆盖概率和区间长度的、经模拟验证的实用指南,以选择最优置信区间。
提出的方法
- 提出四种新置信区间:一种Wald型区间、一种基于Fieller的区间、一种偏差校正的自助法区间,以及一种使用非信息性Beta先验和蒙特卡洛模拟的贝叶斯区间。
- 适配并评估两种已有方法:Pepe(2003)的Wald型置信区间和Roldán-Nofuentes与Luna(2007)的对数变换置信区间。
- 使用德尔塔法推导灵敏度、特异度和似然比的方差-协方差矩阵。
- 通过模拟实验评估各种情境下每种置信区间的覆盖概率和平均长度。
- 将Fieller方法应用于似然比之比,利用其在比率估计中已知的稳健性。
- 基于似然比之比的期望误差范围,利用渐近方差近似推导样本量公式。
实验结果
研究问题
- RQ1在配对二分类诊断试验比较中,哪种置信区间方法对似然比之比的覆盖概率最为准确?
- RQ2不同置信区间的平均长度如何比较?哪种方法在不牺牲覆盖概率的前提下提供了最佳精确度?
- RQ3如何计算样本量以在指定误差范围内估计似然比之比?
- RQ4在现实模拟条件下,所提出的置信区间(如Fieller、自助法)与已有方法的性能特征如何比较?
- RQ5当渐近假设不成立时,贝叶斯区间和自助法区间是否能提供可靠的推断?
主要发现
- 基于Fieller的置信区间展现出最准确的覆盖概率,即使在小样本量下也始终接近名义上的95%水平。
- 偏差校正的自助法区间在覆盖概率方面表现优异,尤其在偏态或小样本情形下具有很强的稳健性。
- Wald型区间覆盖性能差,尤其当真实比值远离1时,因此在推断中不可靠。
- 使用非信息性先验和蒙特卡洛抽样的贝叶斯区间提供了稳定的覆盖概率,但平均区间长度略宽于Fieller方法。
- 模拟结果表明,所提出的样本量公式在应用时能可靠地实现期望的精确度,且覆盖概率接近名义水平。
- 在评估的各类方法中,推荐Fieller和自助法区间用于实际应用,因其在覆盖准确度与精确度之间达到了最佳平衡。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。