Skip to main content
QUICK REVIEW

[論文レビュー] TPLLM: A Traffic Prediction Framework Based on Pretrained Large Language Models

Yilong Ren, Yue Chen|arXiv (Cornell University)|Mar 4, 2024
Traffic Prediction and Management Techniques被引用数 11
ひとこと要約

TPLLM は、CNN ベースのシーケンスエンコーダと GCN ベースのグラフエンコーダを備えた事前学習済み大規模言語モデルを使用し、LoRA で微調整して、全サンプルおよび少数ショットシナリオで交通予測を行う。

ABSTRACT

Traffic prediction constitutes a pivotal facet within the purview of Intelligent Transportation Systems (ITS), and the attainment of highly precise predictions holds profound significance for efficacious traffic management. The precision of prevailing deep learning-driven traffic prediction models typically sees an upward trend with a rise in the volume of training data. However, the procurement of comprehensive spatiotemporal datasets for traffic is often fraught with challenges, primarily stemming from the substantial costs associated with data collection and retention. Consequently, developing a model that can achieve accurate predictions and good generalization ability in areas with limited historical traffic data is a challenging problem. It is noteworthy that the rapidly advancing pretrained Large Language Models (LLMs) of recent years have demonstrated exceptional proficiency in cross-modality knowledge transfer and few-shot learning. Recognizing the sequential nature of traffic data, similar to language, we introduce TPLLM, a novel traffic prediction framework leveraging LLMs. In this framework, we construct a sequence embedding layer based on Convolutional Neural Networks (CNNs) and a graph embedding layer based on Graph Convolutional Networks (GCNs) to extract sequence features and spatial features, respectively. These are subsequently integrated to form inputs that are suitable for LLMs. A Low-Rank Adaptation (LoRA) fine-tuning approach is applied to TPLLM, thereby facilitating efficient learning and minimizing computational demands. Experiments on two real-world datasets demonstrate that TPLLM exhibits commendable performance in both full-sample and few-shot prediction scenarios, effectively supporting the development of ITS in regions with scarce historical traffic data.

研究の動機と目的

  • 歴史データが限られている地域での正確な交通予測を動機付ける。
  • 時空間交通データの少数ショット学習を可能にするために、事前学習済み LLM を活用する。
  • LLM 入力のために、時間的シーケンス特徴とグラフ構造の空間特徴を統合する。
  • モデル全体の再学習なしに、LoRA を用いたコスト効率の高い微調整を実証する。
  • 全データと少数ショット設定の実データセットで性能を検証する。

提案手法

  • 時系列パターンのための CNN ベースのシーケンス埋め込みと、空間構造のための GCN ベースのグラフ埋め込みを組み合わせた二 branch の入力埋め込みを構築する。
  • 埋め込みを融合し、線形層と正規化を用いて LLM の埋め込みサイズにマッピングし、Emb(X) を生成する。
  • 各トランスフォーマーブロックで Low-Rank Adaptation (LoRA) を用いて、パラメータ効率の高い学習を実現するよう、事前学習済み Transformer ベースの LLM を微調整する。
  • LLM 出力を予測ホライズン T′ にマップする線形層を用い、予測を得るために ReLU 活性化を適用する。
  • センサデータの外れ値に対処するために頑健な MAE ロスで訓練する。

実験結果

リサーチクエスチョン

  • RQ1時系列とグラフ埋め込みを備えた事前学習済み LLM は、限られた歴史データで正確な交通予測を達成できるか。
  • RQ2全データと少数ショットの設定の両方で、LoRA ベースの微調整は、完全微調整や従来のベースラインと比較して交通予測でどの程度効果的か。
  • RQ3LoRA のランクを変化させることが、予測精度と効率にどのような影響を与えるか。
  • RQ4時空間埋め込みは、LLMs から交通データへの他モダリティ知識転送を効果的に有効にするか。

主な発見

DatasetModelMAE_15RMSE_15MAPE_15MAE_30RMSE_30MAPE_30MAE_60RMSE_60MAPE_60MAE_AvgRMSE_AvgMAPE_Avg
PeMS04LSTM29.1045.4521.07%27.2543.6619.26%32.2849.5722.45%29.2345.8420.76%
PeMS04STGCN23.5638.1616.07%25.3140.3917.14%30.2946.7020.74%25.9241.2817.66%
PeMS04ASTGCN19.6831.1012.85%21.5233.8913.99%25.7839.9916.94%21.8334.4814.25%
PeMS04STSGCN20.0932.0914.70%21.6034.1815.52%24.8338.5118.35%21.7834.4515.68%
PeMS04TPLLM18.3930.0612.04%19.4331.7612.67%21.4934.8114.20%19.5331.9312.81%
PeMS08LSTM24.1637.7018.52%22.6036.1617.18%26.9441.0520.07%24.2937.9918.42%
PeMS08STGCN20.1230.5813.06%21.2432.2813.72%24.7837.1015.86%21.6932.9214.01%
PeMS08ASTGCN16.1925.0110.37%18.1327.9311.51%22.1633.5313.82%18.3328.3011.64%
PeMS08STSGCN16.2625.0710.61%17.4427.0912.17%19.5930.4112.69%17.5627.1812.08%
PeMS08TPLLM14.2922.969.15%15.4325.349.83%17.2228.4311.05%15.4525.359.88%
  • TPLLM は PeMS04 および PeMS08 において、全サンプルおよび少数ショット設定の双方で LSTM および他の ST-GCN ベースラインを上回る。
  • 全サンプル予測では、15分、30分、60分の各ホライゾンで、両データセットにおいて MAE、RMSE、MAPE の最良を達成。
  • 少数ショット予測では、TPLLM はベースラインより劣化が小さく、事前学習済み LLM からの効果的な少数ショット学習を示す。
  • LoRA によりパラメータの約0.95% を訓練可能にし、計算コストを削減しつつ競争力のある性能を実現。
  • 可視化により、TPLLM が両データセットで典型的な交通パターン(平日ピークと週末の滑らかな日)を捉えていることが示される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。