QUICK REVIEW

[论文解读] Using the Mean Absolute Percentage Error for Regression Models

Arnaud De Myttenaere, Boris Golden|arXiv (Cornell University)|Jun 12, 2015

Control Systems and Identification参考文献 3被引用 35

一句话总结

本文证明，回归中最小化平均百分比误差（MAPE）等价于加权平均绝对误差（MAE）回归，其中权重与目标值成反比。在温和条件下，本文证明了基于MAPE的期望风险最小化（ERM）具有普遍一致性，从而在目标变量远离零时可实现可靠的模型学习。

ABSTRACT

We study in this paper the consequences of using the Mean Absolute Percentage Error (MAPE) as a measure of quality for regression models. We show that finding the best model under the MAPE is equivalent to doing weighted Mean Absolute Error (MAE) regression. We show that universal consistency of Empirical Risk Minimization remains possible using the MAPE instead of the MAE.

研究动机与目标

研究使用MAPE作为回归损失函数而非MSE或MAE的理论与实际影响。
证明最小化MAPE等价于求解一个实例特定权重的加权MAE回归问题。
建立基于MAPE损失函数的期望风险最小化（ERM）的普遍一致性。
分析目标变量边界的（特别是|Y|的下界）对MAPE学习一致性的作用。
探讨在标准学习框架下，MAPE学习是否可获得与MSE和MAE相似的理论保证。

提出的方法

将MAPE损失形式化为 $ l_{MAPE}(p,y) = \frac{|p - y|}{|y|} $，并规定除零的处理方式。
证明最小化经验MAPE等价于求解一个加权MAE回归问题，其中每个样本的权重为 $ \frac{1}{|Y_i|} $。
应用标准统计学习理论技术，包括覆盖数和VC维，以界定经验风险与真实风险之间的偏差。
利用重对称化与集中不等式等方法，通过指数尾部界推导出MAPE下ERM的一致性条件。
证明在MAPE下的假设类的VC维被MAE下的VC维所有界，从而保持理论可处理性。
证明在模型类逐渐增大、VC维递增且无界的条件下，若满足 $ \lim_{n\to\infty} \frac{v_n B_{G_n}^2 \log B_{G_n}}{n} = 0 $ 且几乎必然有 $ |Y| \geq \lambda > 0 $，则MAPE风险几乎必然收敛至最优风险。

实验结果

研究问题

RQ1最小化MAPE是否等价于已知的回归形式？若是，对应的加权损失是什么？
RQ2在统计学习意义上，基于MAPE损失的期望风险最小化能否实现普遍一致性？
RQ3目标变量的边界（特别是|Y|的下界）如何影响MAPE学习的一致性？
RQ4在MAPE下假设类的VC维与在MAE下假设类的VC维之间有何关系？
RQ5在适当的正则性条件下，MSE和MAE的理论一致性结果能否推广至MAPE设置？

主要发现

最小化MAPE在数学上等价于求解一个加权MAE回归问题，其中每个训练样本的权重为绝对目标值的倒数。
理论分析表明，只要目标变量几乎必然远离零（即 $ |Y| \geq \lambda > 0 $），基于MAPE损失的期望风险最小化即可实现普遍一致性。
在MAPE下假设类的VC维被在MAE下假设类的VC维所上界控制，从而保持理论可处理性与一致性保证。
在模型类逐渐增大、VC维递增且无界的条件下，若满足条件 $ \lim_{n\to\infty} \frac{v_n B_{G_n}^2 \log B_{G_n}}{n} = 0 $，则可建立一致性。
通过指数集中不等式与偏差概率的可 summability 性，证明了MAPE下的经验风险最小化几乎必然收敛至最优风险。
在cars数据集上的实际示例表明，MAPE优化模型在训练数据上实现了最低的MAPE，验证了理论等价性在实践中的成立。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。