Skip to main content
QUICK REVIEW

[論文レビュー] T-CGAN: Conditional Generative Adversarial Network for Data Augmentation in Noisy Time Series with Irregular Sampling

Giorgia Ramponi, Pavlos Protopapas|arXiv (Cornell University)|Nov 20, 2018
Image and Signal Denoising Methods参考文献 11被引用数 85
ひとこと要約

T-CGAN は時間条件付きCGANを使用して、不規則にサンプリングされノイズを含む時系列をデータ拡張のために生成し、特にデータセットが小さいまたは不均衡な場合の分類を改善する。

ABSTRACT

In this paper we propose a data augmentation method for time series with irregular sampling, Time-Conditional Generative Adversarial Network (T-CGAN). Our approach is based on Conditional Generative Adversarial Networks (CGAN), where the generative step is implemented by a deconvolutional NN and the discriminative step by a convolutional NN. Both the generator and the discriminator are conditioned on the sampling timestamps, to learn the hidden relationship between data and timestamps, and consequently to generate new time series. We evaluate our model with synthetic and real-world datasets. For the synthetic data, we compare the performance of a classifier trained with T-CGAN-generated data, against the performance of the same classifier trained on the original data. Results show that classifiers trained on T-CGAN-generated data perform the same as classifiers trained on real data, even with very short time series and small training sets. For the real world datasets, we compare our method with other techniques of data augmentation for time series, such as time slicing and time warping, over a classification problem with unbalanced datasets. Results show that our method always outperforms the other approaches, both in case of regularly sampled and irregularly sampled time series. We achieve particularly good performance in case with a small training set and short, noisy, irregularly-sampled time series.

研究の動機と目的

  • 不規則なサンプリングとノイズを伴う時系列データのデータ拡張を提案する。
  • 時刻を明示的に条件付けするCGANベースの手法を開発する。
  • 生成された不規則な時系列が分類タスクのために実データの分布と適合することを実証する。

提案手法

  • GeneratorとDiscriminatorの両方がタイムスタンプを条件にする時刻認識型CGANを提案する。
  • Gにはデコンボリューションニューラルネットワークを、Dには畳み込みニューラルネットワークを用いる。
  • 時間を条件にする最小最大目的関数で学習する: min_G max_D E[x~p_data(x)][log D(x|t)] + E[z~p_z(z)][log(1-D(G(z|t)))] .
  • 不規則なサンプリングと欠損データを含む実世界データセットとともに、合成されたサイン波と鋸波データで評価する。

実験結果

リサーチクエスチョン

  • RQ1T-CGANはタイムスタンプを条件として、現実的な不規則サンプリング時系列を生成できるか。
  • RQ2合成設定において、T-CGANで拡張したデータで訓練した分類器は、実データで訓練した分類器と同等の性能を示すか。
  • RQ3実データの不規則サンプリング時系列に対して、T-CGANは他のデータ拡張法(time slicing、time warping)より優れているか。
  • RQ4実世界の不均衡な時系列データセットにおけるクラスバランス調整に、T-CGANは有効か。
  • RQ5欠損データのレベルや不規則サンプリングの程度が変化した場合、T-CGANはどのように性能を発揮するか。

主な発見

  • T-CGAN生成データで訓練した分類器は、合成された不規則時系列に対して実データで訓練した分類器と同等のAUROCを達成する。
  • 実データセットでは、T-CGANはregularおよびirregularサンプリングの双方において、不均衡な分類タスクでtime slicingおよびtime warpingより優れている。
  • T-CGANは小さな訓練データセットや短くてノイズが多く、不規則にサンプリングされた時系列でも高い性能を示す。
  • 不規則サンプリングが欠損データを増やす場合でもT-CGANは堅牢で、他の拡張法より優れたAUROCを維持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。