[论文解读] High-Quality Prediction Intervals for Deep Learning: A Distribution-Free, Ensembled Approach
引入一种分布无关的损失函数(Quality-Driven, HQ)以产生回归的窄预测区间(PI),并显示 QD-Ens 在十个基准数据集上相较于最先进的 MVE-Ens 提高 PI 质量。
This paper considers the generation of prediction intervals (PIs) by neural networks for quantifying uncertainty in regression tasks. It is axiomatic that high-quality PIs should be as narrow as possible, whilst capturing a specified portion of data. We derive a loss function directly from this axiom that requires no distributional assumption. We show how its form derives from a likelihood principle, that it can be used with gradient descent, and that model uncertainty is accounted for in ensembled form. Benchmark experiments show the method outperforms current state-of-the-art uncertainty quantification methods, reducing average PI width by over 10%.
研究动机与目标
- 以高质量预测区间量化回归中的不确定性。
- 开发一个分布无关且符合 HQ 原则的 PI 输出损失函数。
- 通过集成引入模型不确定性,并与当前最先进的不确定性方法进行比较。
提出的方法
- 从 HQ 原则推导 LossQD 以在固定覆盖度 (1-α) 下最小化 PI 宽度。
- 使用捕获的 MPIWcapt 以避免在错过的数据点处收缩宽度。
- 对 PI 覆盖采用伯努利似然,并应用单边损失项以在 PICP < (1−α) 时强制覆盖。
- 提出可微的(软)版本 LossQD-soft,以实现梯度下降训练。
- 使用 LossQD-soft 训练神经网络的集合以捕获模型不确定性;将集合界限结合形成最终的 PI。
- 基准测试十个公开数据集,与 MVE-Ens 对比,报告 PI 质量度量指标 PICP 和 MPIW。
实验结果
研究问题
- RQ1如何构建一个分布无关的损失函数,在神经网络中产生在指定覆盖度下的窄 PI?
- RQ2一个神经网络集合能否有效捕获 PI 估计中的模型不确定性?
- RQ3在基准数据集上,与 LUBE 和 MVE 相比,提出的 HQ 基损失在 PI 宽度和覆盖率方面有何差异?
主要发现
| 数据集 | PICP_MVE | PICP_QD | MPIW_MVE | MPIW_QD | 改善 |
|---|---|---|---|---|---|
| BOSTON | 1.76 ± 0.28 | 1.33 ± 0.05 | 0.89 ± 0.02 | 0.92 ± 0.01 | NA |
| CONCRETE | 1.23 ± 0.06 | 1.16 ± 0.02 | 0.92 ± 0.01 | 0.94 ± 0.01 | NA |
| ENERGY | 0.50 ± 0.02 | 0.47 ± 0.01 | 0.99 ± 0.00 | 0.97 ± 0.01 | 7% |
| KIN8NM | 1.14 ± 0.01 | 1.24 ± 0.01 | 0.97 ± 0.00 | 0.96 ± 0.00 | -10% |
| NAVAL | 0.31 ± 0.01 | 0.27 ± 0.01 | 0.99 ± 0.00 | 0.98 ± 0.00 | 10% |
| POWER PLANT | 0.91 ± 0.00 | 0.86 ± 0.00 | 0.96 ± 0.00 | 0.95 ± 0.00 | 6% |
| PROTEIN | 2.70 ± 0.01 | 2.28 ± 0.01 | 0.96 ± 0.00 | 0.95 ± 0.00 | 15% |
| WINE | 4.13 ± 0.31 | 3.13 ± 0.19 | 0.90 ± 0.01 | 0.92 ± 0.01 | 7% |
| YACHT | 0.31 ± 0.02 | 0.23 ± 0.02 | 0.98 ± 0.01 | 0.96 ± 0.01 | 43% |
| SONG YEAR | 2.90 ± NA | 2.47 ± NA | 0.96 ± NA | 0.96 ± NA | 15% |
- QD-Ens 在十个数据集的 PI 质量指标上优于 MVE-Ens,PICP 更接近 0.95,MPIW 平均约缩短 11.6%。
- HQ 损失提供了一种鲁棒的分布无关方法,不假设高斯噪声,并在使用软近似时仍保持与梯度下降的竞争力。
- 在保持或提高覆盖率的同时实现 PI 宽度的缩小,展示了在不做分布假设下的有效不确定性量化。
- 集成提供了估计模型不确定性的实际机制,集合的上/下界 PI 由成员预测构成。
- 训练考虑因素显示 LossQD-soft 使基于梯度的优化成为可行,与 MVE-Ens 相比,使用更低的学习率和更多的训练轮次可提高稳定性。
- 论文在将 MVE 输出转换为 PIs 以公平评估 PI 标准方面,与 MVE-Ens 相较结果良好。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。