Skip to main content
QUICK REVIEW

[論文レビュー] Time Series Data Imputation: A Survey on Deep Learning Approaches

Chenguang Fang, Chen Wang|arXiv (Cornell University)|Nov 23, 2020
Time Series Analysis and Forecasting参考文献 52被引用数 35
ひとこと要約

深層学習手法を用いた多変量時系列データの欠損値推定の調査に焦点を当て、GRU-D、GRUI-GAN、E2 GAN、BRITS、NAOMIを中心に、それらのアーキテクチャ、利点、制限を論じる。

ABSTRACT

Time series are all around in real-world applications. However, unexpected accidents for example broken sensors or missing of the signals will cause missing values in time series, making the data hard to be utilized. It then does harm to the downstream applications such as traditional classification or regression, sequential data integration and forecasting tasks, thus raising the demand for data imputation. Currently, time series data imputation is a well-studied problem with different categories of methods. However, these works rarely take the temporal relations among the observations and treat the time series as normal structured data, losing the information from the time data. In recent, deep learning models have raised great attention. Time series methods based on deep learning have made progress with the usage of models like RNN, since it captures time information from data. In this paper, we mainly focus on time series imputation technique with deep learning methods, which recently made progress in this field. We will review and discuss their model architectures, their pros and cons as well as their effects to show the development of the time series imputation methods.

研究の動機と目的

  • 欠測値と不規則な時間ギャップを伴う時系列データにおいて、効果的な補完の必要性を喚起する。
  • 時系列補完に対するディープラーニング手法を分類し、比較する。
  • 欠損補完のためのモデルアーキテクチャ、データ表現(mask、time lag)、および学習戦略を説明する。
  • 手法間の関係を明らかにし、現在のDLベースの補完手法の長所と限界を特定する。

提案手法

  • 補完手法をDLベースと従来の手法に分類する。
  • DLベースの補完に用いられるモデルアーキテクチャ(RNN、GRU、双方向版、GAN)を議論する。
  • 欠損を表現するデータ表現(maskマトリクス、time lag δ)を導入する。
  • 主要モデル GRU-D、GRUI-GAN、E2 GAN、BRITS、NAOMI を説明し、減衰メカニズムと双方向更新を含む。
  • 不規則な時系列の扱い方法と自己符号化器(auto-encoder)および敵対的訓練(adversarial training)が性能をどのように向上させるかを分析する。

実験結果

リサーチクエスチョン

  • RQ1欠 DLベースのアーキテクチャと入力表現は、欠損した時系列値を補完するための時系列ダイナミクスを最もよく捉えるか。
  • RQ2不規則な時間間隔と欠測パターンは、主要なモデルの補完性能にどのような影響を与えるか。
  • RQ3GRU-D、GRUI-GAN、E2 GAN、BRITS、NAOMIの多変量時系列補完における比較的長所と限界は何か。
  • RQ4双方向性と自己符号化器または敵対的訓練は、補完精度を向上させるためにどのように活用されているか。

主な発見

  • DLベースの補完手法(GRU-D、GRUI-GAN、E2 GAN、BRITS、NAOMI)は、RNNやGANを活用して時系列ダイナミクスと欠測をモデル化できる。
  • GRU-Dは、時系列の不規則性を扱うために時間遅延と入力/隠れ層の減衰機構を導入する。
  • GRUI-GANとE2 GANは、補完にGANベースのフレームワークを適用する。E2 GANは訓練安定性を改善するため自己符号化器ジェネレータを使用する。
  • BRITSは、時系列の減衰と一貫性損失を含む双方向RNNに基づく補完を実演し、単方向モデルよりも結果を改善する。
  • NAOMIは、非自己回帰的な双方向RNNと分割統治的予測戦略および敵対的訓練を採用して補完品質を向上させる。
  • この調査は手法間の関係を整理し、注意機構ベース、タイムスタンプ補完、整合性の機会を今後の方向性として特定している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。