[论文解读] T-CGAN: Conditional Generative Adversarial Network for Data Augmentation in Noisy Time Series with Irregular Sampling
T-CGAN 使用一个时间条件的 CGAN 来生成不规则采样、带噪声的时间序列用于数据增强,在小或不平衡数据集上尤其提升分类性能。
In this paper we propose a data augmentation method for time series with irregular sampling, Time-Conditional Generative Adversarial Network (T-CGAN). Our approach is based on Conditional Generative Adversarial Networks (CGAN), where the generative step is implemented by a deconvolutional NN and the discriminative step by a convolutional NN. Both the generator and the discriminator are conditioned on the sampling timestamps, to learn the hidden relationship between data and timestamps, and consequently to generate new time series. We evaluate our model with synthetic and real-world datasets. For the synthetic data, we compare the performance of a classifier trained with T-CGAN-generated data, against the performance of the same classifier trained on the original data. Results show that classifiers trained on T-CGAN-generated data perform the same as classifiers trained on real data, even with very short time series and small training sets. For the real world datasets, we compare our method with other techniques of data augmentation for time series, such as time slicing and time warping, over a classification problem with unbalanced datasets. Results show that our method always outperforms the other approaches, both in case of regularly sampled and irregularly sampled time series. We achieve particularly good performance in case with a small training set and short, noisy, irregularly-sampled time series.
研究动机与目标
- 为不规则采样和噪声的时间序列数据进行数据增强提供动机。
- 开发一个基于 CGAN 的方法,明确对时间戳进行条件化。
- 证明生成的非规则时间序列可以匹配用于分类任务的真实数据分布。
提出的方法
- 提出时间感知的 CGAN,使 Generator 和 Discriminator 均对时间戳进行条件化。
- 对 G 使用反卷积神经网络,对 D 使用卷积神经网络。
- 使用带有对时间条件的 min-max 目标进行训练:min_G max_D E[x~p_data(x)][log D(x|t)] + E[z~p_z(z)][log(1-D(G(z|t)))] 。
- 在合成正弦波与锯齿波数据以及具有不规则采样和缺失数据的真实世界数据集上进行评估。
实验结果
研究问题
- RQ1T-CGAN 能否在时间戳条件下生成现实的、不规则采样的时间序列?
- RQ2在合成设置中,以 T-CGAN 增强数据训练的分类器是否与以真实数据训练的分类器具有可比的性能?
- RQ3在真实不规则采样的时间序列上,T-CGAN 是否优于其他数据增强方法(时间切片、时间扭曲)?
- RQ4T-CGAN 对真实世界的不平衡时间序列数据集的类别平衡是否有效?
- RQ5在不同级别的缺失数据和不规则采样下,T-CGAN 的性能如何?
主要发现
- 在合成不规则时间序列上,使用 T-CGAN 生成的数据训练的分类器的 AUROC 与使用真实数据训练的分类器的 AUROC 相当。
- 在真实数据集上,T-CGAN 在规则采样和不规则采样的两种情况下,在不平衡分类任务中均优于时间切片和时间扭曲。
- T-CGAN 在小的训练集、短而嘈杂、且不规则采样的时间序列上表现出强劲的性能。
- 当不规则采样增加缺失数据时,T-CGAN 仍然鲁棒,相对于其他增强方法保持更优的 AUROC。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。