[论文解读] Estimators for Long Range Dependence: An Empirical Study
本文通过分数布朗噪声和分数整合过程的模拟,评估了长记忆时间序列中12种赫斯特参数H或分数整合参数d的估计器。Whittle估计器和Haslett-Raftery估计器表现最佳,Peng估计器在样本量超过4,000时表现可接受,而其他多个估计器(尤其是R/S和差分方差)在短序列或非理想条件下表现较差。
We present the results of a simulation study into the properties of 12 different estimators of the Hurst parameter, $H$, or the fractional integration parameter, $d$, in long memory time series. We compare and contrast their performance on simulated Fractional Gaussian Noises and fractionally integrated series with lengths between 100 and 10,000 data points and $H$ values between 0.55 and 0.90 or $d$ values between 0.05 and 0.40. We apply all 12 estimators to the Campito Mountain data and estimate the accuracy of their estimates using the Beran goodness of fit test for long memory time series. MCS code: 37M10
研究动机与目标
- 评估长记忆时间序列中12种赫斯特参数H和分数整合参数d估计器的有限样本性能。
- 在样本量(100–10,000)和H/d值(0.55–0.90与0.05–0.40)变化的情况下,比较估计器的偏差、均方误差(MSE)和置信区间宽度。
- 利用Campito Mountain数据和Beran长记忆拟合优度检验,评估估计器的稳健性。
- 识别在不同序列长度和H/d范围内均可靠的估计器,特别是在偏离理想长记忆过程的情况下。
- 基于样本量和所需精度(例如,95%置信区间宽度<0.1)提供估计器选择的实际指导。
提出的方法
- 对长度为100至10,000、H值为0.55至0.90(d值为0.05至0.40)的分数布朗噪声(FGN)和分数整合(FI(d))序列进行10,000次模拟重复。
- 实现12种估计器:绝对值、聚合方差、方框周期图、差分方差、Higuchi、Peng、周期图、R/S、小波、Whittle、GPH和Haslett-Raftery。
- 使用偏差、均方误差(MSE)和H与d估计值的95%置信区间宽度来评估性能。
- 将所有估计器应用于Campito Mountain数据,并使用Beran拟合优度检验评估数据是否符合FGN模型。
- 使用Beran检验评估在FGN假设下,估计的H值是否在统计上与长记忆一致。
- 通过比较理想FGN过程与存在偏离FGN的现实世界数据中估计器的表现,评估稳健性。
实验结果
研究问题
- RQ1在不同样本量和H/d值范围内,哪些H或d估计器表现出最低的偏差和均方误差(MSE)?
- RQ2随着样本量增加,特别是低于4,000个观测值时,12种估计器的性能特征(偏差、MSE、置信区间宽度)如何变化?
- RQ3哪些估计器在整个长记忆参数范围内,能保持95%置信区间宽度小于0.1个单位的H或d?
- RQ4估计器对纯FGN模型的偏离有多稳健,这在Campito Mountain数据中的差异中如何体现?
- RQ5当应用于存在结构突变或非平稳性(在模拟的FGN中不存在)的现实世界数据时,哪些估计器仍保持可靠?
主要发现
- Whittle估计器和Haslett-Raftery估计器整体表现最佳,在整个关注范围内均实现了低偏差和MSE,且95%置信区间宽度低于0.1。
- 对于样本量小于4,000的序列,仅Whittle和Haslett-Raftery估计器满足95%置信区间宽度小于0.1的标准;Whittle估计器需超过700个观测值,Haslett-Raftery估计器需超过1,000个观测值才能达到该标准。
- Peng估计器在样本量为4,000或以上的序列中表现可接受,其MSE接近周期图估计器。
- 当序列长度超过7,000时,周期图估计器成为可行选择,表现出更高的精度。
- 小波估计器仅在序列长度超过8,200时变得可靠,此时偏差可忽略不计。
- 在Campito Mountain数据中,12种估计器中有6种(包括R/S、差分方差等)报告了与FGN模型不一致的统计显著H估计值,表明其对现实世界中理想长记忆过程的偏离缺乏稳健性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。