QUICK REVIEW

[論文レビュー] Calibrated Bayesian Nonparametric Tolerance Intervals

Tony Pourmohamad, Robert Richardson|arXiv (Cornell University)|Mar 11, 2026

Statistical Methods and Inference被引用数 0

ひとこと要約

完全非参数法：对总体分位数应用经过校准的 Gibbs 后验，构建单边与双边容忍区间，名义频率覆盖；在样本量小或分布非标准时，区间常比传统基准更短。

ABSTRACT

Tolerance intervals provide bounds that contain a specified proportion of a population with a given confidence level, yet their construction remains challenging when parametric assumptions fail or sample sizes are small. Traditional nonparametric methods, such as Wilks' intervals, lack flexibility and often require large samples to be valid. We propose a fully nonparametric approach for constructing one-sided and two-sided tolerance intervals using a calibrated Gibbs posterior. Leveraging the connection between tolerance limits and population quantiles, we employ a Gibbs posterior based on the asymmetric Laplace (check) loss function. A key feature of our method is the calibration of the learning rate, which ensures nominal frequentist coverage across diverse distributional shapes. Simulation studies show that the proposed approach often yields shorter intervals than classical nonparametric benchmarks while maintaining reliable coverage. The framework's practical utility is illustrated through applications in ecology, biopharmaceutical manufacturing, and environmental monitoring, demonstrating its flexibility and robustness across diverse applications.

研究の動機と目的

将容忍区间作为在给定置信度下包含总体比例的界限来动机化，尤其在参数化假设失效时。
开发一种使用 Gibbs 后验的完全非参数方法来推断定义容忍边界的总体分位数。
利用检查损失（钉球损失）直接将目标定为分位数，而非对数似然。
通过对学习率进行校准，在多样分布下实现名义的频率覆盖。
提供单边和双边容忍区间程序，并给出实际的校准与计算指南。

提案手法

采用广义贝叶斯（Gibbs）框架，其中对分位数 Q_tau 的后验与 exp(-eta * sum_i ell(Q_tau; Y_i)) 成正比，ell 为检查损失。
使用检查损失 rho_tau(r) = r( tau - I{r<0} ) 将目标定为总体分位数 Q_tau。
将单边界限 U 构建为 pi(Q_P | Y) 的 (1-alpha) 后验分位数，将 L 构建为 pi(Q_{1-P} | Y) 的 alpha 后验分位数。
对于双边区间，使用（Q_tauL, Q_tauU）的一组后验并结合对称性规则导出 [L,U] 以符合覆盖率；重新参数化以强制 Q_tauU > Q_tauL。
通过 Robbins-Monro 随机逼近对 eta 进行校准，以在基于自放回/bootstrap 的估计下满足覆盖约束（分位数校准或内容校准）。
提供一个无参数似然的实际非参数推断流程，可选的信息先验与标准 MCMC 方法用于后验采样。

Figure 1: Joint Gibbs posterior draws of $(Q_{\tau_{L}},Q_{\tau_{U}})$ and the symmetry-based two-sided tolerance interval construction.

実験結果

リサーチクエスチョン

RQ1在多样分布下，经过校准的总体分位数 Gibbs 后验是否能够产生有效的频率容忍区间？
RQ2学习率 eta 的校准如何影响单边和双边容忍区间的覆盖率与区间长度？
RQ3采用联合分位数（双边）结构并通过对称性总结是否能在保持名义覆盖的同时产生比基准更短的区间？
RQ4在小样本和重尾情形中，Cal-Gibbs 的单边/双边区间相较 Wilks、YM、BQR-AL、Ext-AL 的表现如何？
RQ5该方法是否能够在一个统一的非参数框架中定义分位数定义的与内容定义的容忍？

主な発見

Distribution	Method	P=0.90 Coverage	P=0.95 Coverage	P=0.99 Coverage	P=0.90 Length	P=0.95 Length	P=0.99 Length
N(0,1)	Cal-Gibbs	0.896	0.905	0.905	1.733	2.030	2.656
N(0,1)	Wilks	0.886	0.907	0.899	1.921	2.213	2.784
N(0,1)	YM	0.902	0.899	0.906	1.898	2.205	2.772
N(0,1)	BQR-AL	0.997	1.000	1.000	2.208	2.545	3.196
N(0,1)	Ext-AL	0.873	0.716	0.998	1.654	1.790	12.237
Gamma(2,1)	Cal-Gibbs	0.895	0.893	0.901	4.916	5.776	7.661
Gamma(2,1)	Wilks	0.900	0.890	0.894	5.544	6.354	8.241
Gamma(2,1)	YM	0.901	0.898	0.902	5.531	6.345	8.239
Gamma(2,1)	BQR-AL	0.943	0.933	0.936	5.082	5.885	7.745
Gamma(2,1)	Ext-AL	0.679	0.367	1.000	4.256	4.592	35.507
Pareto(1,2)	Cal-Gibbs	0.899	0.898	0.893	4.877	7.211	17.082
Pareto(1,2)	Wilks	0.893	0.903	0.902	9.418	12.892	24.822
Pareto(1,2)	YM	0.902	0.903	0.894	9.261	12.875	24.793
Pareto(1,2)	BQR-AL	0.942	0.875	0.694	4.807	6.473	12.360
Pareto(1,2)	Ext-AL	0.638	0.399	0.968	3.826	4.538	17.714
0.9N(0,1)+0.1N(0,100)	Cal-Gibbs	0.892	0.908	0.899	3.976	6.748	18.802
0.9N(0,1)+0.1N(0,100)	Wilks	0.903	0.899	0.898	8.323	11.832	20.262
0.9N(0,1)+0.1N(0,100)	YM	0.899	0.899	0.906	8.295	11.820	20.244
0.9N(0,1)+0.1N(0,100)	BQR-AL	0.989	0.959	0.643	4.446	6.407	15.066
0.9N(0,1)+0.1N(0,100)	Ext-AL	0.894	0.736	0.886	3.678	4.321	18.371

经过校准的 Gibbs 区间在正态、伽玛、帕累托以及一个重尾正态混合分布下，经验覆盖率接近名义的 0.90 水平。
在仿真中，Cal-Gibbs 常比 Wilks 与 YM 基准得到更短的区间，同时保持覆盖，特别是在重尾或小样本情形。
在尾部重尾情形下，使用固定工作似然的贝叶斯方法（BQR-AL、Ext-AL）显示出不稳定性或覆盖不足，凸显需要显式校准。
通过联合后验和对称性规则得到的双边区间具有适当的覆盖，而边际后验可能错过联合的可行性并未达到目标覆盖。
鲁棒性检验表明在低于常见 Wilks 阈值的一系列样本量下，Cal-Gibbs 仍维持接近名义的覆盖，而非参数方法可能表现不佳。

Figure 2: Empirical performance of upper one-sided tolerance intervals with content level $P=0.9$ and confidence level $1-\alpha=0.9$ as a function of sample size. Left panel: empirical coverage probability, with the dashed horizontal line indicating the nominal confidence level. Right panel: averag

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。