Skip to main content
QUICK REVIEW

[論文レビュー] Scalable Low-Rank Autoregressive Tensor Learning for Spatiotemporal Traffic Data Imputation.

Xinyu Chen, Yixian Chen|arXiv (Cornell University)|Aug 7, 2020
Traffic Prediction and Management Techniques被引用数 2
ひとこと要約

本稿では、大規模な時空間交通データの補完に向けたスケーラブルな低ランク自己回帰的テンソル補完モデルであるLATC-Tubalを提案する。ユニタリ変換とチューブラル核ノルム最小化を統合することで、1日ごとの特異値しきい値処理を効率的に行いながら、日ごとの相関関係を保持することができ、実世界のPeMSデータセット(11,160台のセンサー)において、顕著に低い計算コストで最先端の精度を達成した。

ABSTRACT

Missing value problem in spatiotemporal traffic data has long been a challenging topic, in particular for large-scale and high-dimensional data with complex missing mechanisms and diverse degrees of missingness. Recent studies based on tensor nuclear norm have demonstrated the superiority of tensor learning in imputation tasks by effectively characterizing the complex correlations/dependencies in spatiotemporal data. However, despite the promising results, these approaches do not scale well to large tensors. In this paper, we focus on addressing the missing data imputation problem for large-scale spatiotemporal traffic data. To achieve both high accuracy and efficiency, we develop a scalable autoregressive tensor learning model---Low-Tubal-Rank Autoregressive Tensor Completion (LATC-Tubal)---based on the existing framework of Low-Rank Autoregressive Tensor Completion (LATC), which is well-suited for spatiotemporal traffic data that characterized by multidimensional structure of location$ imes$ time of day $ imes$ day. In particular, the proposed LATC-Tubal model involves a scalable tensor nuclear norm minimization scheme by integrating linear unitary transformation. Therefore, the tensor nuclear norm minimization can be solved by singular value thresholding on the transformed matrix of each day while the day-to-day correlation can be effectively preserved by the unitary transform matrix. Before setting up the experiment, we consider two large-scale 5-minute traffic speed data sets collected by the California PeMS system with 11160 sensors. We compare LATC-Tubal with state-of-the-art baseline models, and find that LATC-Tubal can achieve competitively accuracy with a significantly lower computational cost. In addition, the LATC-Tubal will also benefit other tasks in modeling large-scale spatiotemporal traffic data, such as network-level traffic forecasting.

研究の動機と目的

  • 複雑な欠損メカニズムを有する大規模かつ高次元の時空間交通データにおける欠損データの課題に対処すること。
  • 大規模なテンソルに対して既存のテンソル核ノルムベースの補完手法のスケーラビリティの限界を克服すること。
  • 効率的な計算を可能にする線形ユニタリ変換を用いて、交通データの日ごとの相関関係を保持すること。
  • 実用的導入に適した高精度な補完精度を維持しながら、計算コストを顕著に削減するモデルを開発すること。
  • 補完を越えて、ネットワークレベルの交通予測などの関連タスクへの広範な適用性を実現すること。

提案手法

  • 時空間交通データの3次元構造(場所 × 時間帯 × 日)を想定し、低ランク自己回帰的テンソル補完(LATC)に基づく新規なテンソル補完フレームワーク、LATC-Tubalを提案する。
  • ユニタリ変換を介したチューブラル核ノルム最小化方式を導入し、3次元テンソルを1日ごとの2次元行列の集合に変換することで、特異値しきい値処理を効率的に行う。
  • 各日の変換後行列に対して特異値しきい値処理を適用し、時間的相関を保持しつつ低ランク構造を近似する。
  • 最適化プロセス中に日ごとの依存関係を維持するため、ユニタリ変換行列を用いることで構造的一致性を確保する。
  • 変換後に1日ごとの計算を分離することで、テンソルサイズに線形にスケールする効率的な最適化アルゴリズムを設計する。
  • 時間帯次元における時間的ダイナミクスを捉えるために自己回帰モデリングを統合し、予測精度を向上させる。

実験結果

リサーチクエスチョン

  • RQ1チューブラル核ノルムに基づくテンソル補完モデルは、複雑な欠損パターンを有する大規模な時空間交通データにおいて、高い補完精度を達成できるか?
  • RQ2ユニタリ変換の統合により、交通データの日ごとの相関関係を保持しながら、スケーラブルな計算が可能になるか?
  • RQ3実世界のデータセットにおいて、LATC-Tubalは最先端のベースラインと比較して、補完精度と計算効率の両面で優れているか?
  • RQ4LATC-Tubalは、交通予測などの他の時空間モデリングタスクへどの程度一般化可能か?
  • RQ5PeMSのような11,000台を超えるセンサーを有する大規模なセンサーネットワークにスケーリングする際、モデルの精度と計算コストのトレードオフはどのようなものか?

主な発見

  • LATC-Tubalは、カリフォルニア州PeMSシステムの5分間隔交通速度データ2件の大型スケールデータセットにおいて、最先端のモデルと比較して競争力ある補完精度を達成した。
  • 既存のテンソル核ノルムベースの手法と比較して、計算コストを顕著に低減し、11,160台のセンサーを有する大規模なテンソルへのスケーラビリティを実現した。
  • ユニタリ変換は、交通パターンの日ごとの相関関係を効果的に保持しており、長期的な時間的依存関係を捉える能力が向上した。
  • 行列変換を介したチューブラル核ノルムの使用により、1日ごとの効率的な特異値しきい値処理が可能となり、最適化プロセスの計算的実行可能性が確保された。
  • スケーラブルで高精度な設計のため、ネットワークレベルの交通予測などの他の時空間タスクへの応用可能性が強く示された。
  • 実験結果により、本手法が、実世界の交通システムに一般的に見られる多様で複雑な欠損データメカニズムに対しても、高い性能を維持することが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。