Skip to main content
QUICK REVIEW

[论文解读] High-Quality Prediction Intervals for Deep Learning: A Distribution-Free, Ensembled Approach

Tim Pearce, Mohamed Zaki|arXiv (Cornell University)|Feb 20, 2018
Adversarial Robustness in Machine Learning参考文献 27被引用 150
一句话总结

引入一种分布无关的损失函数(Quality-Driven, HQ)以产生回归的窄预测区间(PI),并显示 QD-Ens 在十个基准数据集上相较于最先进的 MVE-Ens 提高 PI 质量。

ABSTRACT

This paper considers the generation of prediction intervals (PIs) by neural networks for quantifying uncertainty in regression tasks. It is axiomatic that high-quality PIs should be as narrow as possible, whilst capturing a specified portion of data. We derive a loss function directly from this axiom that requires no distributional assumption. We show how its form derives from a likelihood principle, that it can be used with gradient descent, and that model uncertainty is accounted for in ensembled form. Benchmark experiments show the method outperforms current state-of-the-art uncertainty quantification methods, reducing average PI width by over 10%.

研究动机与目标

  • 以高质量预测区间量化回归中的不确定性。
  • 开发一个分布无关且符合 HQ 原则的 PI 输出损失函数。
  • 通过集成引入模型不确定性,并与当前最先进的不确定性方法进行比较。

提出的方法

  • 从 HQ 原则推导 LossQD 以在固定覆盖度 (1-α) 下最小化 PI 宽度。
  • 使用捕获的 MPIWcapt 以避免在错过的数据点处收缩宽度。
  • 对 PI 覆盖采用伯努利似然,并应用单边损失项以在 PICP < (1−α) 时强制覆盖。
  • 提出可微的(软)版本 LossQD-soft,以实现梯度下降训练。
  • 使用 LossQD-soft 训练神经网络的集合以捕获模型不确定性;将集合界限结合形成最终的 PI。
  • 基准测试十个公开数据集,与 MVE-Ens 对比,报告 PI 质量度量指标 PICP 和 MPIW。

实验结果

研究问题

  • RQ1如何构建一个分布无关的损失函数,在神经网络中产生在指定覆盖度下的窄 PI?
  • RQ2一个神经网络集合能否有效捕获 PI 估计中的模型不确定性?
  • RQ3在基准数据集上,与 LUBE 和 MVE 相比,提出的 HQ 基损失在 PI 宽度和覆盖率方面有何差异?

主要发现

数据集PICP_MVEPICP_QDMPIW_MVEMPIW_QD改善
BOSTON1.76 ± 0.281.33 ± 0.050.89 ± 0.020.92 ± 0.01NA
CONCRETE1.23 ± 0.061.16 ± 0.020.92 ± 0.010.94 ± 0.01NA
ENERGY0.50 ± 0.020.47 ± 0.010.99 ± 0.000.97 ± 0.017%
KIN8NM1.14 ± 0.011.24 ± 0.010.97 ± 0.000.96 ± 0.00-10%
NAVAL0.31 ± 0.010.27 ± 0.010.99 ± 0.000.98 ± 0.0010%
POWER PLANT0.91 ± 0.000.86 ± 0.000.96 ± 0.000.95 ± 0.006%
PROTEIN2.70 ± 0.012.28 ± 0.010.96 ± 0.000.95 ± 0.0015%
WINE4.13 ± 0.313.13 ± 0.190.90 ± 0.010.92 ± 0.017%
YACHT0.31 ± 0.020.23 ± 0.020.98 ± 0.010.96 ± 0.0143%
SONG YEAR2.90 ± NA2.47 ± NA0.96 ± NA0.96 ± NA15%
  • QD-Ens 在十个数据集的 PI 质量指标上优于 MVE-Ens,PICP 更接近 0.95,MPIW 平均约缩短 11.6%。
  • HQ 损失提供了一种鲁棒的分布无关方法,不假设高斯噪声,并在使用软近似时仍保持与梯度下降的竞争力。
  • 在保持或提高覆盖率的同时实现 PI 宽度的缩小,展示了在不做分布假设下的有效不确定性量化。
  • 集成提供了估计模型不确定性的实际机制,集合的上/下界 PI 由成员预测构成。
  • 训练考虑因素显示 LossQD-soft 使基于梯度的优化成为可行,与 MVE-Ens 相比,使用更低的学习率和更多的训练轮次可提高稳定性。
  • 论文在将 MVE 输出转换为 PIs 以公平评估 PI 标准方面,与 MVE-Ens 相较结果良好。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。