Skip to main content
QUICK REVIEW

[논문 리뷰] Multi-resolution Time-Series Transformer for Long-term Forecasting

Yitian Zhang, Liheng Ma|arXiv (Cornell University)|2023. 11. 07.
Time Series Analysis and Forecasting인용 수 18
한 줄 요약

MTST는 상대 위치 인코딩을 갖춘 다중 가지치기, 다중 해상도 패치 기반 트랜스포머를 도입하여 장기 다변량 예측의 다양한 시간 패턴을 모델링하고, 벤치마크에서 최첨단 결과를 달성한다.

ABSTRACT

The performance of transformers for time-series forecasting has improved significantly. Recent architectures learn complex temporal patterns by segmenting a time-series into patches and using the patches as tokens. The patch size controls the ability of transformers to learn the temporal patterns at different frequencies: shorter patches are effective for learning localized, high-frequency patterns, whereas mining long-term seasonalities and trends requires longer patches. Inspired by this observation, we propose a novel framework, Multi-resolution Time-Series Transformer (MTST), which consists of a multi-branch architecture for simultaneous modeling of diverse temporal patterns at different resolutions. In contrast to many existing time-series transformers, we employ relative positional encoding, which is better suited for extracting periodic components at different scales. Extensive experiments on several real-world datasets demonstrate the effectiveness of MTST in comparison to state-of-the-art forecasting techniques.

연구 동기 및 목표

  • 장기간 예측에서 다 스케일 시간 패턴을 모델링해야 하는 필요성 제기.
  • 다양한 주파수를 포착하기 위해 서로 다른 패치 크기를 사용하는 다중 분기 MTST 제안.
  • 주기 성분을 더 잘 포착하기 위해 상대 위치 인코딩 채택.
  • 여러 실제 데이터셋에서 우수한 예측 성능 시연 및 설계 선택을 정당화하는 비제약(ablations) 제시

제안 방법

  • 다른 패치 크기로 입력을 토큰화하는 서로 다른 분기를 가진 N개의 계층으로 MTST 구축.
  • 각 분기에서 상대 위치 인코딩이 있는 자기 주의로 처리되는 패치 수준 토큰 사용.
  • 다음 계층을 위한 공유 임베딩을 형성하기 위해 MTST 계층에서 분기 표현을 융합.
  • 채널 독립성으로 각 시계열 채널을 독립적으로 처리하고, 크로스 채널 의존성으로 확장 가능성 제시.
  • Adam으로 MSE를 최소화하도록 학습; 입력에 인스턴스 정규화 적용 및 출력에 역정규화 적용

실험 결과

연구 질문

  • RQ1다중 해상도 다중 분기 트랜스포머가 단일 해상도 패치 기반 모델보다 장기 예측을 개선하는가?
  • RQ2MTST에서 상대 위치 인코딩과 절대 위치 인코딩의 차이는 어떤 영향을 미치는가?
  • RQ3고해상도/저해상도 분기를 포함하거나 제외하는 ablations가 성능에 어떤 영향을 미치는가?
  • RQ4MTST가 다양한 실제 데이터셋과 예측 시점에서 최첨단 대조군과 비교하여 어떤 성능을 보이는가?

주요 결과

데이터셋TMTST_MSEMTST_MAEPatchTST_MSEPatchTST_MAEDLinear_MSEDLinear_MAEMICN_MSEMICN_MAETimesNet_MSETimesNet_MAEFedformer_MSEFedformer_MAEAutoformer_MSEAutoformer_MAEPyraformer_MSEPyraformer_MAE
Traffic960.3560.2440.3670.2510.4100.2820.4730.2930.5950.3180.5760.3590.5970.3712.0850.468
Traffic1920.3750.2510.3850.2590.4230.2870.4830.2980.6150.3260.6100.3800.6070.3820.8670.467
Traffic3360.3860.2560.3980.2650.4360.2960.4910.3030.6160.3260.6080.3750.6230.3870.8690.469
Traffic7200.4250.2790.4340.2870.4660.3150.5590.3270.6550.3530.6210.3750.6390.3950.8810.473
Electricity960.1270.2220.1300.2220.1400.2370.1570.2660.1780.2840.1860.3020.1960.3130.3860.449
Electricity1920.1440.2380.1480.2400.1530.2490.1750.2870.1870.2890.1970.3110.2110.3240.3860.443
Electricity3360.1620.2560.1670.2610.1690.2670.2000.3080.2080.3070.2130.3280.2140.3270.3780.443
Electricity7200.1990.2890.2020.2910.2030.3010.2280.3380.2450.3210.2330.3440.2360.3420.3760.445
Weather960.1500.1990.1520.1990.1760.2370.1780.2490.1630.2190.2380.3140.2490.3290.8960.556
Weather1920.1940.2400.1970.2430.2110.2690.2430.2690.2110.2590.2750.3290.3250.3700.6220.624
Weather3360.2460.2810.2490.2830.2650.3190.2780.3380.2860.3110.3390.3770.3510.3910.7390.753
Weather7200.3190.3330.3200.3350.3230.3620.3200.3600.3590.3630.3890.4090.4150.4261.0040.934
ETTh1960.3580.3900.3750.3990.3750.3990.4130.4420.4210.4400.3760.4150.4350.4460.6640.612
ETTh11920.3960.4140.4140.4210.4050.4160.4510.4620.5110.4980.4230.4460.4560.4570.7900.681
ETTh13360.3910.4200.4310.4360.4390.4430.5560.5280.4840.4780.4440.4620.4860.4870.8910.738
ETTh17200.4300.4570.4490.4660.4720.4900.6580.6070.5540.5270.4690.4920.5150.5170.9630.782
ETTh2960.2570.3260.2740.3360.2890.3530.3030.3640.3660.4170.3320.3740.3320.3680.6450.597
ETTh21920.3090.3610.3390.3790.3830.4180.4030.4460.4260.4470.4070.4460.4260.4340.7880.683
ETTh23360.3020.3660.3310.3800.4480.4650.6030.5500.4060.4350.4000.4470.4770.4790.9070.747
ETTh27200.3720.4160.3790.4220.6050.5511.1060.8520.4270.4570.4120.4690.4530.4900.9630.783
ETTm1960.2860.3380.2900.3420.2990.3430.3080.3600.3560.3850.3260.3900.5100.4920.5430.510
ETTm11920.3270.3660.3320.3690.3350.3650.3430.3840.4520.4280.3650.4150.5140.4950.5570.537
ETTm13360.3620.3890.3660.3920.3690.3860.3950.4110.4190.4250.3920.4250.5100.4920.7540.655
ETTm17200.4140.4210.4200.4240.4250.4210.4270.4340.4520.4510.4460.4580.5270.4930.9080.724
ETTm2960.1620.2510.1650.2550.1670.2600.1690.2680.1880.2760.1800.2710.2050.2930.4350.507
ETTm21920.2200.2910.2200.2920.2240.3030.2470.3330.2420.3100.2520.3180.2780.3360.7300.673
ETTm23360.2720.3260.2780.3290.2810.3420.2900.3510.3000.3460.3240.3640.3430.3791.2010.845
ETTm27200.3580.3790.3670.3850.3970.4210.4170.4340.3910.4030.4100.4200.4140.4193.6251.451
  • MTST는 7개 데이터셋, 4가지 예측 시점, 2개 지표에서 최첨단 성능을 달성한다.
  • MTST는 28개 MSE 비교 중 27개에서 PatchTST를 능가하며 통계적으로 유의미한 차이를 보인다.
  • 저해상도 또는 고해상도 분기를 제거하면 성능이 저하되어 다중 스케일 모델링의 가치가 입증된다.
  • 상대 위치 인코딩은 절대 인코딩에 비해 예측 정확도를 일관되게 향상시킨다.
  • Look-back 윈도우 분석 및 질적 시각화는 MTST의 다중 스케일 시간 구조 포착 우위를 확인한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.