Skip to main content
QUICK REVIEW

[論文レビュー] FOCAL: Contrastive Learning for Multimodal Time-Series Sensing Signals in Factorized Orthogonal Latent Space

Shengzhong Liu, Tomoyoshi Kimura|arXiv (Cornell University)|Oct 30, 2023
Music and Audio Processing被引用数 8
ひとこと要約

FOCALは自己教師付き対照フレームワークを導入し、マルチモーダル時系列データの表現を共有特徴とモダリティ専有特徴の双方を学習する因子分解された直交潜在空間で獲得し、表現と下流タスクを改善する時間局所性制約を導入する。

ABSTRACT

This paper proposes a novel contrastive learning framework, called FOCAL, for extracting comprehensive features from multimodal time-series sensing signals through self-supervised training. Existing multimodal contrastive frameworks mostly rely on the shared information between sensory modalities, but do not explicitly consider the exclusive modality information that could be critical to understanding the underlying sensing physics. Besides, contrastive frameworks for time series have not handled the temporal information locality appropriately. FOCAL solves these challenges by making the following contributions: First, given multimodal time series, it encodes each modality into a factorized latent space consisting of shared features and private features that are orthogonal to each other. The shared space emphasizes feature patterns consistent across sensory modalities through a modal-matching objective. In contrast, the private space extracts modality-exclusive information through a transformation-invariant objective. Second, we propose a temporal structural constraint for modality features, such that the average distance between temporally neighboring samples is no larger than that of temporally distant samples. Extensive evaluations are performed on four multimodal sensing datasets with two backbone encoders and two classifiers to demonstrate the superiority of FOCAL. It consistently outperforms the state-of-the-art baselines in downstream tasks with a clear margin, under different ratios of available labels. The code and self-collected dataset are available at https://github.com/tomoyoshki/focal.

研究の動機と目的

  • 共有情報とモダリティ限定情報の両方を活用して、マルチモーダル時系列表現の理解を促進する。
  • 共有特徴と私有特徴を分離する因子分解直交潜在空間を開発する。
  • 事前訓練時の時系列構造を尊重する時間局所性制約を導入する。
  • 共有、私有、直交性、時間的制約の損失項を concrete に設計する。
  • 複数のデータセットとバックボーンにわたり下流性能の向上を示す。

提案手法

  • 各モダリティを共有部と私有部を含む因子分解潜在空間にエンコードする。
  • 共有空間と私有空間のモダリティ別・モダリティ間対照損失を適用する(共有空間は InfoNCE、私有空間は NT-Xent)。
  • 共有部と私有部の直交性、さらには異なるモダリティの私有空間間の直交性を強制する。
  • 事前訓練中の平均 intra-sequence 距離が平均 inter-sequence 距離以下となるよう時間局所性制約を課す。
  • 記憶バンクを用いず、モダリティごとのランダムデータ拡張と同バッチ内対照を用いて学習する。
Figure 1: Overview of the FOCAL framework. Best viewed in color.
Figure 1: Overview of the FOCAL framework. Best viewed in color.

実験結果

リサーチクエスチョン

  • RQ1モーダル共有情報とモーダル個別情報を明示的にモデル化することで、マルチモーダル時系列表現はどのように豊かになるか?
  • RQ2共有空間と私有空間の直交性を課すと、下流の識別性能は改善されるか?
  • RQ3自己教師付き事前学習中に時間的局所性制約は時系列構造をより適切に反映できるか?
  • RQ4FOCAL の各成分は多様なデータセットで下流の分類・クラスタリングタスクにどのような影響を与えるか?
  • RQ5FOCAL はラベル希少性に頑健で、バックボーンエンコーダの移植性があるか?

主な発見

DatasetEncoderFrameworkAccF1AccF1AccF1AccF1
MODDeepSenseSupervised0.94040.93990. -0. -0. -0. -0. -0. -
MODDeepSenseSimCLR0.88550.88550.74380.61010.71380.68410.68020.6583
MODDeepSenseMoCo0.88080.88120.77170.62050.78590.77080.75590.7387
MODDeepSenseCMC0.91960.91860.84430.72440.79750.81160.79060.7706
MODDeepSenseMAE0.59810.59930.66440.56180.75650.75150.71140.6158
MODDeepSenseCosmo0.89890.89980.85110.69290.89560.88880.83560.8135
MODDeepSenseCocoa0.87740.87640.66440.53590.84650.84880.76030.7187
MODDeepSenseMTSS0.41530.35820.43520.24410.29890.14050.35410.1795
MODDeepSenseTS2Vec0.76690.76480.52240.35870.65950.59840.57290.4715
MODDeepSenseGMC0.92570.92670.90960.79290.88690.89480.81190.7860
MODDeepSenseTNC0.95180.95280.82370.69360.88920.89710.83870.8143
MODDeepSenseTS-TCC0.87070.87350.76670.61640.80730.80100.77760.7250
MODDeepSenseFOCAL0.97320.97290.95160.85800.93820.92900.85880.8463
MODSW-TSupervised0.89480.89310.91370.77700.93130.92780.86120.8384
MODSW-TSimCLR0.92500.92470.91280.81440.70460.72200.77050.7424
MODSW-TMoCo0.93900.93840.91740.81000.78130.80240.77170.7313
MODSW-TCMC0.91290.91050.81280.68570.88400.89550.80800.7901
MODSW-TMAE0.78030.77720.85160.70230.88290.88130.79100.7606
MODSW-TCosmo0.34290.33780.71100.60860.86040.81690.77410.7366
MODSW-TCocoa0.70400.70380.70960.57940.88920.88610.76890.7317
MODSW-TMTSS0.42060.41630.34290.22500.51360.43700.28470.1714
MODSW-TTS2Vec0.72540.71740.71830.57480.61510.59550.61950.5426
MODSW-TGMC0.86400.86110.94020.77660.93190.93790.83120.8083
MODSW-TTNC0.85330.85390.83520.73720.88170.87840.80130.7506
MODSW-TTS-TCC0.87340.87350.90410.75470.87310.84540.79970.7260
MODSW-TFOCAL0.98050.98000.94890.82620.94510.95030.85800.8401
ACIDSDeepSenseSupervised0.95660.84070. -0. -0. -0. -0. -0. -
ACIDSDeepSenseSimCLR0.74380.61010. -0. -0. -0. -0. -0. -
ACIDSDeepSenseMoCo0.77170.62050. -0. -0. -0. -0. -0. -
ACIDSDeepSenseCMC0.84430.72440. -0. -0. -0. -0. -0. -
ACIDSDeepSenseMAE0.66440.56180. -0. -0. -0. -0. -0. -
ACIDSDeepSenseCosmo0.85110.69290. -0. -0. -0. -0. -0. -
ACIDSDeepSenseCocoa0.66440.53590. -0. -0. -0. -0. -0. -
ACIDSDeepSenseMTSS0.43520.24410. -0. -0. -0. -0. -0. -
ACIDSDeepSenseTS2Vec0.52240.35870. -0. -0. -0. -0. -0. -
ACIDSDeepSenseGMC0.90960.79290. -0. -0. -0. -0. -0. -
ACIDSDeepSenseTNC0.82370.69360. -0. -0. -0. -0. -0. -
ACIDSDeepSenseTS-TCC0.76670.61640. -0. -0. -0. -0. -0. -
ACIDSDeepSenseFOCAL0.95160.85800. -0. -0. -0. -0. -0. -
ACIDSSW-TSupervised0.91370.77700. -0. -0. -0. -0. -0. -
ACIDSSW-TSimCLR0.91280.81440. -0. -0. -0. -0. -0. -
ACIDSSW-TMoCo0.91740.81000. -0. -0. -0. -0. -0. -
ACIDSSW-TCMC0.81280.68570. -0. -0. -0. -0. -0. -
ACIDSSW-TMAE0.85160.70230. -0. -0. -0. -0. -0. -
ACIDSSW-TCosmo0.71100.60860. -0. -0. -0. -0. -0. -
ACIDSSW-TCocoa0.70960.57940. -0. -0. -0. -0. -0. -
ACIDSSW-TMTSS0.34290.22500. -0. -0. -0. -0. -0. -
ACIDSSW-TTS2Vec0.71830.57480. -0. -0. -0. -0. -0. -
ACIDSSW-TGMC0.94020.77660. -0. -0. -0. -0. -0. -
ACIDSSW-TTNC0.83520.73720. -0. -0. -0. -0. -0. -
ACIDSSW-TTS-TCC0.90410.75470. -0. -0. -0. -0. -0. -
ACIDSSW-TFOCAL0.94890.82620. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseSupervised0.93480.93880. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseSimCLR0.71380.68410. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseMoCo0.78590.77080. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseCMC0.79750.81160. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseMAE0.75650.75150. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseCosmo0.89560.88880. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseCocoa0.84650.84880. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseMTSS0.29890.14050. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseTS2Vec0.65950.59840. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseGMC0.88690.89480. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseTNC0.88920.89710. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseTS-TCC0.80730.80100. -0. -0. -0. -0. -0. -
RealWorld-HARDeepSenseFOCAL0.93820.92900. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TSupervised0.93130.92780. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TSimCLR0.70460.72200. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TMoCo0.78130.80240. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TCMC0.88400.89550. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TMAE0.88290.88130. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TCosmo0.86040.81690. -0. -0. -0. -0. -0. -
RealWorld-HARSW-TCocoa0.774?0. -0. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseSupervised0.88490.87610. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseSimCLR0.68020.65830. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseMoCo0.75590.73870. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseCMC0.79060.77060. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseMAE0.71140.61580. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseCosmo0.83560.81350. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseCocoa0.76030.71870. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseMTSS0.35410.17950. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseTS2Vec0.57290.47150. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseGMC0.81190.80830. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseTNC0.83870.81430. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseTS-TCC0.77760.72500. -0. -0. -0. -0. -0. -
PAMAP2DeepSenseFOCAL0.85880.84630. -0. -0. -0. -0. -0. -
PAMAP2SW-TSupervised0.86120.83840. -0. -0. -0. -0. -0. -
PAMAP2SW-TSimCLR0.77050.74240. -0. -0. -0. -0. -0. -
PAMAP2SW-TMoCo0.77170.73130. -0. -0. -0. -0. -0. -
PAMAP2SW-TCMC0.80800.79010. -0. -0. -0. -0. -0. -
PAMAP2SW-TMAE0.79100.76060. -0. -0. -0. -0. -0. -
PAMAP2SW-TCosmo0.77410.73660. -0. -0. -0. -0. -0. -
PAMAP2SW-TCocoa0.76890.73170. -0. -0. -0. -0. -0. -
PAMAP2SW-TMTSS0.284?0.17140. -0. -0. -0. -0. -0. -
PAMAP2SW-TTS2Vec0.61950.54260. -0. -0. -0. -0. -0. -
PAMAP2SW-TGMC0.83120.80830. -0. -0. -0. -0. -0. -
PAMAP2SW-TTNC0.80130.75060. -0. -0. -0. -0. -0. -
PAMAP2SW-TTS-TCC0.79970.72600. -0. -0. -0. -0. -0. -
PAMAP2SW-TFOCAL0.85800.84010. -0. -0. -0. -0. -0. -
  • FOCAL は 4 つのマルチモーダルデータセットと 2 つのバックボーンで、線形探索と KNN 微調整のベースライン11件を一貫して上回る。
  • 私有空間と直交性制約は、共有情報のみを用いる場合より顕著な利得を生む。
  • 時間局所性制約は収束を早め、事前訓練時の意味構造を改善する。
  • 時間的制約は FO CAL 自体のフレームワークを超えた複数のベースラインにもプラグインとして改善効果を発揮する。
  • アブレーションでは私有空間または直交性を取り除くと性能が低下し、時間制約は追加の利得を提供する。
Figure 2: Information diagram between CMC and the proposed FOCAL. Figure adapted from [ tian2020contrastive ] . Blue color denotes used information sectors.
Figure 2: Information diagram between CMC and the proposed FOCAL. Figure adapted from [ tian2020contrastive ] . Blue color denotes used information sectors.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。