[論文レビュー] Financial Time-Series Forecasting: Towards Synergizing Performance And Interpretability Within a Hybrid Machine Learning Approach
この論文はビットコイン価格予測のためのハイブリッドML手法を比較し、Lasso回帰が最良のMAEを示し、線形・木構造・LSTMモデルの中で予測スコアが高い。
In the realm of cryptocurrency, the prediction of Bitcoin prices has garnered substantial attention due to its potential impact on financial markets and investment strategies. This paper propose a comparative study on hybrid machine learning algorithms and leverage on enhancing model interpretability. Specifically, linear regression(OLS, LASSO), long-short term memory(LSTM), decision tree regressors are introduced. Through the grounded experiments, we observe linear regressor achieves the best performance among candidate models. For the interpretability, we carry out a systematic overview on the preprocessing techniques of time-series statistics, including decomposition, auto-correlational function, exponential triple forecasting, which aim to excavate latent relations and complex patterns appeared in the financial time-series forecasting. We believe this work may derive more attention and inspire more researches in the realm of time-series analysis and its realistic applications.
研究の動機と目的
- 暗号市場内での正確なビットコイン価格予測を動機づける。
- 従来の統計手法と機械学習を組み合わせたハイブリッドMLアプローチを評価する。
- 前処理とモデル選択の分析を通じてモデルの解釈性を向上させる。
- 時系列予測において予測性能と説明可能性のバランスを取るモデルを特定する。
提案手法
- 正規化とローリング特徴統計量でビットコイン価格データを前処理する。
- 複数のモデルを比較する:移動平均を用いた線形回帰、Lasso回帰、決定木、長短期記憶(LSTM)。
- MAEとスコアを指標として性能を評価するためにクロスバリデーションとバックテストを用いる。
- グリッドサーチによるハイパーパラメータ調整(例:木の深さ、葉あたりの最小サンプル数)。
- 各モデル(決定木、線形対正則化回帰)の解釈性洞察を定性的に報告する。
実験結果
リサーチクエスチョン
- RQ1この設定でビットコイン終値の予測精度を最も高める回帰または学習モデルはどれか?
- RQ2正則化(Lasso)は時系列予測で基本的な線形回帰を上回るか?
- RQ3木ベースとニューラルネットワークモデルは性能と解釈性の両方でビットコイン価格においてどのように比較されるか?
主な発見
| Method | MAE(Val) | Score |
|---|---|---|
| Naive Linear Regression | 96.20 | 0.9998 |
| Lasso Regression | 91.80 | 0.9997 |
| Decision Tree | 135.02 | 0.9988 |
- Lasso Regression は、比較されたモデルの中で最良の MAE (91.80) を達成する。
- Naive Linear Regression はスコア 0.9998 で最高の一貫性を達成する。
- Decision Tree は MAE (135.02) で劣り、スコアもわずかに低い (0.9988)。
- LSTM モデルの収束がこの設定では不十分であり、本タスクのデータまたはモデルの制約を示している。
- 移動平均特徴を用いた線形回帰は依然として競争力があり、データの時間的線形性を強調している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。