Skip to main content
QUICK REVIEW

[论文解读] An Introductory Study on Time Series Modeling and Forecasting

Ratnadip Adhikari, R. K. Agrawal|arXiv (Cornell University)|Feb 26, 2013
Stock Market Forecasting Methods参考文献 34被引用 509
一句话总结

本文通过在六个真实世界数据集上评估三类主要模型——随机模型(例如ARIMA)、神经网络和支撑向量机(SVM)——对时间序列建模与预测提供了全面的介绍。研究强调模型简洁性,采用五种性能指标(MSE、MAD、RMSE、MAPE、Theil’s U),并表明模型选择显著影响预测准确性,其中SVM和神经网络在复杂、非线性数据上通常优于传统随机模型。

ABSTRACT

Time series modeling and forecasting has fundamental importance to various practical domains. Thus a lot of active research works is going on in this subject during several years. Many important models have been proposed in literature for improving the accuracy and effectiveness of time series forecasting. The aim of this dissertation work is to present a concise description of some popular time series forecasting models used in practice, with their salient features. In this thesis, we have described three important classes of time series models, viz. the stochastic, neural networks and SVM based models, together with their inherent forecasting strengths and weaknesses. We have also discussed about the basic issues related to time series modeling, such as stationarity, parsimony, overfitting, etc. Our discussion about different time series models is supported by giving the experimental forecast results, performed on six real time series datasets. While fitting a model to a dataset, special care is taken to select the most parsimonious one. To evaluate forecast accuracy as well as to compare among different models fitted to a time series, we have used the five performance measures, viz. MSE, MAD, RMSE, MAPE and Theil's U-statistics. For each of the six datasets, we have shown the obtained forecast diagram which graphically depicts the closeness between the original and forecasted observations. To have authenticity as well as clarity in our discussion about time series modeling and forecasting, we have taken the help of various published research works from reputed journals and some standard books.

研究动机与目标

  • 为研究人员和实践者提供关键时间序列预测模型的简明、易懂的概述。
  • 评估随机模型、神经网络和基于SVM的模型在预测真实世界时间序列时的优势与劣势。
  • 强调模型简洁性,避免时间序列建模中的过拟合。
  • 使用标准化且广泛接受的准确度指标,在多样化数据集上比较模型性能。
  • 通过六个真实时间序列数据集的实证结果支持研究发现,增强实际应用价值。

提出的方法

  • 本研究评估了三类主要的时间序列模型:随机模型(例如ARIMA)、神经网络和支撑向量机(SVM)。
  • 针对每个数据集,拟合多种模型,优先基于简洁性选择模型以避免过拟合。
  • 使用五种性能指标——均方误差(MSE)、平均绝对偏差(MAD)、均方根误差(RMSE)、平均百分比误差(MAPE)和Theil’s U统计量——评估并比较预测准确性。
  • 生成图形化预测图,以视觉方式比较所有数据集的原始值与预测值。
  • 分析基于既有的文献和标准教科书,以确保方法论的严谨性和清晰性。
  • 在六个真实世界时间序列数据集上开展实验,以确保实证有效性与实际适用性。

实验结果

研究问题

  • RQ1在多样化的真实世界数据集中,哪类时间序列预测模型——随机模型、神经网络或SVM——能实现最高的预测准确度?
  • RQ2标准性能指标(MSE、MAPE、Theil’s U)在多大程度上能对不同模型的预测可靠性进行排序?
  • RQ3模型简洁性在多大程度上能提升预测性能并减少过拟合?
  • RQ4在不同类型的时序数据中,预测值与实际观测值在视觉和定量上如何对比?
  • RQ5各类模型在处理时间序列中的非线性和结构变化方面,其内在优势与局限性是什么?

主要发现

  • 基于SVM的模型在非线性和不规则时间序列上持续实现了更低的MAPE和Theil’s U值,表明其在复杂模式下具有更高的预测准确度。
  • 神经网络模型在具有强非线性趋势和季节性的数据集上优于传统随机模型,尤其在长期预测中表现更优。
  • ARIMA及其他随机模型在平稳、线性和季节性时间序列上表现更佳,尤其是在模型阶数被仔细选择时。
  • Theil’s U统计量的使用表明,某些模型(尤其是SVM)在减少预测误差方差方面优于其他模型。
  • 图形化预测图证实,SVM和神经网络模型在非平稳和高波动序列上产生的预测值与实际观测值的对齐程度优于随机模型。
  • 模型简洁性被证明至关重要:过度参数化的模型在小样本数据集中容易导致过拟合,从而降低泛化性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。