[논문 리뷰] Forecasting NIFTY 50 benchmark Index using Seasonal ARIMA time series models
이 연구는 인도의 국립주식거래소(National Stock Exchange of India)에서 제공한 2009–2019년의 월간 종가 데이터 11년치를 활용하여 NIFTY 50 지수의 예측에 계절적 ARIMA(SARIMA) 모델을 적용한다. AIC(Akaike Information Criterion)를 통해 선정된 SARIMA(2,2,1)×(2,2,1,12) 모델은 6개월의 홀드아웃 검증에서 0.9% MAPE와 139.67 RMSE를 기록하여 인도의 대표주식지수에 대해 높은 예측 정확도를 보였다.
This paper analyses how Time Series Analysis techniques can be applied to capture movement of an exchange traded index in a stock market. Specifically, Seasonal Auto Regressive Integrated Moving Average (SARIMA) class of models is applied to capture the movement of Nifty 50 index which is one of the most actively exchange traded contracts globally [1]. A total of 729 model parameter combinations were evaluated and the most appropriate selected for making the final forecast based on AIC criteria [8]. NIFTY 50 can be used for a variety of purposes such as benchmarking fund portfolios, launching of index funds, exchange traded funds (ETFs) and structured products. The index tracks the behaviour of a portfolio of blue chip companies, the largest and most liquid Indian securities and can be regarded as a true reflection of the Indian stock market [2].
연구 동기 및 목표
- 인도 주식시장의 대표지수인 NIFTY 50 지수에 대한 강력한 시계열 예측 모델을 개발하기 위해.
- 계절적 ARIMA(SARIMA) 모델이 지수 가격 움직임의 추세와 계절성을 효과적으로 포착할 수 있는지 평가하기 위해.
- 예측 정확도 향상을 위해 Akaike Information Criterion(AIC)를 기반으로 최적의 SARIMA 모수 조합을 식별하기 위해.
- 표준 오차 지표를 사용하여 2019년 1월에서 6월까지의 홀드아웃 기간에서 모델의 예측 성능을 검증하기 위해.
- 2009–2019년 전체 데이터셋을 기반으로 2020년 1월에서 12월까지의 out-of-sample 예측을 생성하기 위해.
제안 방법
- 연구는 2008년 이전 데이터는 경기 후 구조적 변화가 있었기에 제외한 2009–2019년의 월간 NIFTY 50 종가 데이터 11년치를 NSE 웹사이트에서 확보하였다.
- 시계열 분해를 적용하여 추세, 계절성(12개월 주기), 잔차 노이즈 성분을 식별하였다.
- 총 729개의 SARIMA(p,d,q)×(P,D,Q,12) 모델 조합을 AIC(Akaike Information Criterion)를 사용하여 평가하여 최적의 모델을 선정하였다.
- SARIMA 모델 구조는 비계절성 성분(p,d,q)과 계절성 성분(P,D,Q,m)을 모두 포함하며, 연간 계절성을 반영하기 위해 m=12로 설정하였다.
- 2018년 1월에서 12월까지의 1단계 앞선 예측을 수행하여 모델 성능을 평가하였다.
- 최종 모델은 2009–2019년 전체 데이터셋으로 재학습하여 2020년 1월에서 12월까지의 12개월 예측을 생성하였다.
실험 결과
연구 질문
- RQ1계절적 ARIMA 모델은 NIFTY 50 지수 시계열의 추세와 계절 패턴을 효과적으로 포착할 수 있는가?
- RQ2AIC를 선정 기준으로 삼을 때, NIFTY 50 지수를 예측하기 위한 최적의 SARIMA 모수 조합(p,d,q,P,D,Q,m)은 무엇인가?
- RQ3선택된 SARIMA 모델은 6개월의 홀드아웃 기간 동안 NIFTY 50 지수 예측에 대해 얼마나 정확한가?
- RQ4선택된 모델은 학습 기간 이후에도 신뢰할 수 있는 out-of-sample 예측을 생성할 수 있는가?
- RQ5비계절적 ARIMA 모델에 비해 계절 차분을 포함함으로써 예측 정확도가 얼마나 향상되는가?
주요 결과
- SARIMA(2,2,1)×(2,2,1,12) 모델은 가장 낮은 AIC 점수 1008.06을 기록하여 최적의 모델로 선정되었다.
- 6개월 홀드아웃 검증 기간(2019년 1월~6월) 동안 평균 절대 퍼센트 오차(MAPE)는 0.9%를 기록하였다.
- 동일한 검증 기간 동안의 제곱근 평균제곱오차(RMSE)는 139.67이었으며, 실제 값은 10,800에서 11,800 사이를 오갔다.
- 시계열 분해 결과, NIFTY 50 지수에는 명확한 12개월 주기의 계절 패턴과 4년 주기의 순환 추세가 존재하는 것으로 확인되었다.
- 모델은 검증 윈도우 기간 동안 99.1%의 예측 정확도를 기록하여 높은 예측 정확도를 입증하였다.
- 최종 모델은 2009–2019년 전체 데이터셋을 기반으로 2020년 1월에서 12월까지의 NIFTY 50 지수에 대한 12개월 예측을 생성하는 데 사용되었다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.