[论文解读] Calibrated Bayesian Nonparametric Tolerance Intervals
一个完全无参数的方法,使用对总体分位数的经过校准的 Gibbs 后验来构造具有名义置信覆盖的单边和双边容忍区间,通常在经典基准下获得更短的区间,尤其在样本量小或分布非标准时。
Tolerance intervals provide bounds that contain a specified proportion of a population with a given confidence level, yet their construction remains challenging when parametric assumptions fail or sample sizes are small. Traditional nonparametric methods, such as Wilks' intervals, lack flexibility and often require large samples to be valid. We propose a fully nonparametric approach for constructing one-sided and two-sided tolerance intervals using a calibrated Gibbs posterior. Leveraging the connection between tolerance limits and population quantiles, we employ a Gibbs posterior based on the asymmetric Laplace (check) loss function. A key feature of our method is the calibration of the learning rate, which ensures nominal frequentist coverage across diverse distributional shapes. Simulation studies show that the proposed approach often yields shorter intervals than classical nonparametric benchmarks while maintaining reliable coverage. The framework's practical utility is illustrated through applications in ecology, biopharmaceutical manufacturing, and environmental monitoring, demonstrating its flexibility and robustness across diverse applications.
研究动机与目标
- 将容忍区间作为包含总体比例的界限并给出指定置信度的动机,尤其在参数假设失效时。
- 开发一种使用 Gibbs 后验的完全非参数方法,以推断定义容忍上、下界的总体分位数。
- 利用 check(pinball)损失直接针对分位数,而不需要似然函数。
- 通过对学习率进行校准,在不同分布下实现名义的频率覆盖。
- 提供单边和双边容忍区间程序,以及实际的校准和计算指南。
提出的方法
- 采用广义贝叶斯(Gibbs)框架,其中对分位数 Q_tau 的后验与 exp(-eta * sum_i ell(Q_tau; Y_i)) 成正比,ell 为 check 损失。
- 使用 check(pinball)损失 rho_tau(r) = r( tau - I{r<0} ) 来定位第 tau 个总体分位数 Q_tau。
- 构建单边界限 U 作为 pi(Q_P | Y) 的 (1-alpha) 后验分位数,L 作为 pi(Q_{1-P} | Y) 的 alpha 后验分位数。
- 对于双边区间,使用一个关于 (Q_tauL, Q_tauU) 的联合后验并通过对称性规则推导 [L,U],以满足覆盖率;重新参数化以确保 Q_tauU > Q_tauL。
- 通过 Robbins-Monro 随机逼近对 eta 进行校准,以在基于自助法估计(分位数校准或内容校准)下满足覆盖约束。
- 提供一种不存在参数化似然的实用非参数推断流程,可选的信息先验和用于后验采样的标准 MCMC 方法。

实验结果
研究问题
- RQ1一个经校准的 Gibbs 后验是否能在多样化分布下产生有效的频率容忍区间?
- RQ2通过校准学习率 eta,单边和双边容忍区间的覆盖率和区间长度如何变化?
- RQ3结合对称性概括的联合分位 construction 是否能在提供更短区间的同时保持名义覆盖?
- RQ4在样本量较小且尾部重的情况下,单边和双边 Cal-Gibbs 区间与 Wilks、YM、BQR-AL、Ext-AL 的比较如何?
- RQ5该方法是否能在一个统一的非参数框架内定义分位数定义和内容定义的容忍?
主要发现
| Distribution | Method | P=0.90 Coverage | P=0.95 Coverage | P=0.99 Coverage | P=0.90 Length | P=0.95 Length | P=0.99 Length |
|---|---|---|---|---|---|---|---|
| N(0,1) | Cal-Gibbs | 0.896 | 0.905 | 0.905 | 1.733 | 2.030 | 2.656 |
| N(0,1) | Wilks | 0.886 | 0.907 | 0.899 | 1.921 | 2.213 | 2.784 |
| N(0,1) | YM | 0.902 | 0.899 | 0.906 | 1.898 | 2.205 | 2.772 |
| N(0,1) | BQR-AL | 0.997 | 1.000 | 1.000 | 2.208 | 2.545 | 3.196 |
| N(0,1) | Ext-AL | 0.873 | 0.716 | 0.998 | 1.654 | 1.790 | 12.237 |
| Gamma(2,1) | Cal-Gibbs | 0.895 | 0.893 | 0.901 | 4.916 | 5.776 | 7.661 |
| Gamma(2,1) | Wilks | 0.900 | 0.890 | 0.894 | 5.544 | 6.354 | 8.241 |
| Gamma(2,1) | YM | 0.901 | 0.898 | 0.902 | 5.531 | 6.345 | 8.239 |
| Gamma(2,1) | BQR-AL | 0.943 | 0.933 | 0.936 | 5.082 | 5.885 | 7.745 |
| Gamma(2,1) | Ext-AL | 0.679 | 0.367 | 1.000 | 4.256 | 4.592 | 35.507 |
| Pareto(1,2) | Cal-Gibbs | 0.899 | 0.898 | 0.893 | 4.877 | 7.211 | 17.082 |
| Pareto(1,2) | Wilks | 0.893 | 0.903 | 0.902 | 9.418 | 12.892 | 24.822 |
| Pareto(1,2) | YM | 0.902 | 0.903 | 0.894 | 9.261 | 12.875 | 24.793 |
| Pareto(1,2) | BQR-AL | 0.942 | 0.875 | 0.694 | 4.807 | 6.473 | 12.360 |
| Pareto(1,2) | Ext-AL | 0.638 | 0.399 | 0.968 | 3.826 | 4.538 | 17.714 |
| 0.9N(0,1)+0.1N(0,100) | Cal-Gibbs | 0.892 | 0.908 | 0.899 | 3.976 | 6.748 | 18.802 |
| 0.9N(0,1)+0.1N(0,100) | Wilks | 0.903 | 0.899 | 0.898 | 8.323 | 11.832 | 20.262 |
| 0.9N(0,1)+0.1N(0,100) | YM | 0.899 | 0.899 | 0.906 | 8.295 | 11.820 | 20.244 |
| 0.9N(0,1)+0.1N(0,100) | BQR-AL | 0.989 | 0.959 | 0.643 | 4.446 | 6.407 | 15.066 |
| 0.9N(0,1)+0.1N(0,100) | Ext-AL | 0.894 | 0.736 | 0.886 | 3.678 | 4.321 | 18.371 |
- 经过校准的 Gibbs 区间在正态、伽马、帕累托以及重尾正态混合分布上,经验覆盖率接近名义水平 0.90。
- 在仿真实验中,Cal-Gibbs 常比 Wilks 与 YM 基准获得更短的区间,同时保持覆盖率,尤其在尾部重或样本量较小时。
- 在尾部重分布下,使用固定工作似然的贝叶斯方法(BQR-AL、Ext-AL)表现出不稳定性或覆盖不足,凸显需要显式校准。
- 使用联合后验及对称性规则的双边区间能提供适当的覆盖,而边际后验可能错过联合的合理性,无法达到目标覆盖。
- 鲁棒性检验表明 Cal-Gibbs 在多种样本量下维持接近名义覆盖率,而非参数方法在某些情形下表现不佳。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。