[論文レビュー] A specifically designed machine learning algorithm for GNSS position time series prediction and its applications in outlier and anomaly detection and earthquake prediction
本論文では、平均除去、トレンド除去、ウェーブレットを用いた周波数成分の分離、および正弦・余弦関数を用いた三角関数的重み付けを統合することで、位置時間系列を予測するGNSS特化型の機械学習アルゴリズムを提案する。グローバルな3,000基のGNSS局での研究において17の他のアルゴリズムを上回り、優れた精度と高速性を達成しており、地震の早期予測(2011年東北地震では2時間前)や、非常に高い精度の外れ値検出(他の手法より3.22%優れている)が可能である。
We present a simple yet efficient supervised machine learning algorithm that is designed for the GNSS position time series prediction. This algorithm has four steps. First, the mean value of the time series is subtracted from it. Second, the trends in the time series are removed. Third, wavelets are used to separate the high and low frequencies. And fourth, a number of frequencies are derived and used for finding the weights between the hidden and the output layers, using the product of the identity and sine and cosine functions. The role of the observation precision is taken into account in this algorithm. A large-scale study of three thousand position times series of GNSS stations across the globe is presented. Seventeen different machine learning algorithms are examined. The accuracy levels of these algorithms are checked against the rigorous statistical method of Theta. It is shown that the most accurate machine learning algorithm is the method we present, in addition to being faster. Two applications of the algorithm are presented. In the first application, it is shown that the outliers and anomalies in a time series can be detected and removed by the proposed algorithm. In a large scale study, ten other methods of time series outlier detection are compared with the proposed algorithm. The study reveals that the proposed algorithm is approximately 3.22 percent more accurate in detecting outliers. In the second application, the suitability of the algorithm for earthquake prediction is investigated. A case study is presented for the Tohoku 2011 earthquake. It is shown that this earthquake could have been predicted approximately 2 hours before its happening, solely based on each of the 845 GEONET station time series. Comparison with four different studies show the improvement in prediction of the time of the earthquake.
研究の動機と目的
- GNSS位置時間系列に特有の特徴(低振幅の座標変化、トレンド、複数周波数成分を含む)を考慮した機械学習アルゴリズムの開発。
- 3,000基のグローバルなGNSS時間系列において、17種類の従来の機械学習手法と統計的ベンチマーク(Theta)と比較して、本アルゴリズムの性能を評価すること。
- リアルタイムGNSSデータにおける外れ値や異常を検出するための本アルゴリズムの有効性を示すこと。
- GNSSデータに含まれる前震動変形信号を用いて、早期地震予測の可能性を調査すること。
提案手法
- アルゴリズムはまず、GNSS時間系列から平均値を差し引いてデータを中央化する。
- 専用のトレンド検出と除去ステップを用いて、線形または非線形トレンドを除去する。
- ウェーブレット変換を適用して、信号を高周波数成分と低周波数成分に分解する。
- 主要周波数を特定し、恒等関数と正弦・余弦関数の積を用いて、隠れ層と出力層間の重みを計算する。
- 観測精度をモデル学習プロセスに明示的に組み込み、測定の信頼性を反映する。
- データの60%を用いて学習を行い、最小限の遅延で将来の位置と異常を予測可能とする。
実験結果
リサーチクエスチョン
- RQ1GNSS時間系列に特化して設計された機械学習アルゴリズムは、汎用的アルゴリズムに比べ、予測精度と速度で優れているか?
- RQ2本手法は、実際のGNSS時間系列に組み込まれた模擬的外れ値を、既存の外れ値検出技術と比較してどれほど効果的に検出できるか?
- RQ3GNSSデータに含まれる前震動変形信号は、十分に早期に検出可能で、信頼性のある地震発生時刻の予測が可能か?
- RQ4観測精度を組み込むことで、GNSS時間系列モデリングにおける予測性能はどの程度向上するか?
主な発見
- 本手法は、3,000基のGNSS時間系列を対象としたグローバルな研究において、17種類の機械学習手法および統計的Theta手法と比較して、最高の予測精度を達成した。
- 他の手法と比較して、少なくとも3倍の高速性を示し、顕著な計算効率を実現した。
- 外れ値検出において、10,000個の模擬的外れ値を含む2,000件の実時間系列を用いたテストで、10種類の競合手法と比較して3.22%高い精度を達成した。
- 2011年東北地震では、データの60%のみを用いて、破壊発生の約2時間45秒前に予測が可能であり、地盤変動の誤差は約19%であった。
- データの10%のみを用いた場合、地震は12時間4分30秒前に予測可能であったが、マグニチュード推定の誤差は40%であった。
- 本手法は、振幅が3 cmに満たない前震動信号をも正確に検出でき、信頼できる予測のための閾値を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。