Skip to main content
QUICK REVIEW

[논문 리뷰] A specifically designed machine learning algorithm for GNSS position time series prediction and its applications in outlier and anomaly detection and earthquake prediction

Mostafa Kiani Shahvandi|arXiv (Cornell University)|2020. 06. 16.
Time Series Analysis and Forecasting참고 문헌 21인용 수 7
한 줄 요약

이 논문은 평균 제거, 추세 제거, 웨이블릿 기반 주파수 분離, 사인 및余弦 함수를 사용한 삼각함수 가중치 부여를 통합하여 위치 시간 시리즈를 예측하는 GNSS에 특화된 새로운 기계학습 알고리즘을 제안한다. 이 알고리즘은 전 세계 3,000개의 GNSS 정거장에서 수행된 연구에서 17개의 다른 알고리즘을 압도적으로 뛰어넘는 뛰어난 정확도와 속도를 달성하였으며, 지진 예측(예: 2011년 동일본 대지진 2시간 전 예측 가능)과 매우 정확한 이질치 탐지(기존 방법 대비 3.22% 높은 정확도)를 가능하게 한다.

ABSTRACT

We present a simple yet efficient supervised machine learning algorithm that is designed for the GNSS position time series prediction. This algorithm has four steps. First, the mean value of the time series is subtracted from it. Second, the trends in the time series are removed. Third, wavelets are used to separate the high and low frequencies. And fourth, a number of frequencies are derived and used for finding the weights between the hidden and the output layers, using the product of the identity and sine and cosine functions. The role of the observation precision is taken into account in this algorithm. A large-scale study of three thousand position times series of GNSS stations across the globe is presented. Seventeen different machine learning algorithms are examined. The accuracy levels of these algorithms are checked against the rigorous statistical method of Theta. It is shown that the most accurate machine learning algorithm is the method we present, in addition to being faster. Two applications of the algorithm are presented. In the first application, it is shown that the outliers and anomalies in a time series can be detected and removed by the proposed algorithm. In a large scale study, ten other methods of time series outlier detection are compared with the proposed algorithm. The study reveals that the proposed algorithm is approximately 3.22 percent more accurate in detecting outliers. In the second application, the suitability of the algorithm for earthquake prediction is investigated. A case study is presented for the Tohoku 2011 earthquake. It is shown that this earthquake could have been predicted approximately 2 hours before its happening, solely based on each of the 845 GEONET station time series. Comparison with four different studies show the improvement in prediction of the time of the earthquake.

연구 동기 및 목표

  • GNSS 위치 시간 시리즈의 고유한 특성(저진폭 좌표 변화, 추세, 다중 주파수 신호 등)을 고려하여 특화된 기계학습 알고리즘 개발.
  • 3,000개의 글로벌 GNSS 시간 시리즈에서 17개의 기존 기계학습 방법과 통계적 기준(Theta)을 대비로 알고리즘 성능 평가.
  • 실시간 GNSS 데이터에서 이질치 및 이상치를 탐지하는 데서의 알고리즘의 유용성 입증.
  • GNSS 데이터의 전지진 변형 신호를 활용하여 조기 지진 예측 가능성을 탐구.

제안 방법

  • 알고리즘은 먼저 GNSS 시간 시리즈에서 평균을 빼서 데이터를 중심화한다.
  • 전용 추세 탐지 및 제거 단계를 통해 선형 또는 비선형 추세를 제거한다.
  • 웨이블릿 변환을 적용하여 신호를 고주파 및 저주파 성분으로 분해한다.
  • 핵심 주파수를 도출하고, 은닉층과 출력층 간의 가중치 계산에 신원함수와 사인/余현수 함수의 곱을 사용한다.
  • 관측 정밀도를 모델 훈련 과정에 명시적으로 통합하여 측정 신뢰도를 반영한다.
  • 데이터의 60%를 훈련에 사용하여 향후 위치와 이상치를 최소 지연으로 예측할 수 있도록 한다.

실험 결과

연구 질문

  • RQ1GNSS 시간 시리즈에 특화된 기계학습 알고리즘이 일반 목적 알고리즘보다 예측 정확도와 속도에서 뛰어난 성능을 보일 수 있는가?
  • RQ2기존의 이질치 탐지 기법과 비교해 볼 때, 제안된 방법은 실제 GNSS 시간 시리즈 내에서 시뮬레이션된 이질치 탐지에 얼마나 효과적인가?
  • RQ3GNSS 데이터의 전지진 변형 신호를 얼마나 일찍 탐지할 수 있는가? 이를 통해 신뢰할 수 있는 지진 발생 시간 예측이 가능한가?
  • RQ4관측 정밀도를 GNSS 시간 시리즈 모델링에 통합할 경우 예측 성능 향상 정도는 어느 정도인가?

주요 결과

  • 제안된 알고리즘은 전 세계 3,000개의 GNSS 시간 시리즈에서 17개의 기계학습 방법과 통계적 Theta 방법 중에서 가장 높은 예측 정확도를 달성했다.
  • 기존 방법 대비 최소 3배 이상의 빠른 속도를 보이며 뚜렷한 계산 효율성을 입증했다.
  • 이상치 탐지에서, 2,000개의 실제 시간 시리즈에 10,000개의 시뮬레이션된 이상치를 적용한 테스트에서 10개의 경쟁 방법보다 3.22% 높은 정확도를 기록했다.
  • 2011년 동일본 대지진의 경우, 데이터의 60%만을 사용하여 파손 발생 약 2시간 45초 전에 사건을 예측했으며, 지반 이동 오차는 약 19%였다.
  • 데이터의 10%만을 사용한 경우, 12시간 4분 30초 전에 지진을 예측할 수 있었지만, 진폭 추정 오차는 40%였다.
  • 전지진 신호를 약 3cm의 진폭으로도 성공적으로 탐지하여 신뢰할 수 있는 예측의 한계를 확인했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.