Skip to main content
QUICK REVIEW

[論文レビュー] Unlocking the Value of Text: Event-Driven Reasoning and Multi-Level Alignment for Time Series Forecasting

Siyuan Wang, Peng Chen|arXiv (Cornell University)|Mar 16, 2026
Time Series Analysis and Forecasting被引用数 0
ひとこと要約

VoT は外生テキストと内生テキストを利用し、イベント駆動の推論とマルチレベルの整合性を通じて時系列予測を改善し、10個の実世界データセットで最先端の結果を達成します。

ABSTRACT

Existing time series forecasting methods primarily rely on the numerical data itself. However, real-world time series exhibit complex patterns associated with multimodal information, making them difficult to predict with numerical data alone. While several multimodal time series forecasting methods have emerged, they either utilize text with limited supplementary information or focus merely on representation extraction, extracting minimal textual information for forecasting. To unlock the Value of Text, we propose VoT, a method with Event-driven Reasoning and Multi-level Alignment. Event-driven Reasoning combines the rich information in exogenous text with the powerful reasoning capabilities of LLMs for time series forecasting. To guide the LLMs in effective reasoning, we propose the Historical In-context Learning that retrieves and applies historical examples as in-context guidance. To maximize the utilization of text, we propose Multi-level Alignment. At the representation level, we utilize the Endogenous Text Alignment to integrate the endogenous text information with the time series. At the prediction level, we design the Adaptive Frequency Fusion to fuse the frequency components of event-driven prediction and numerical prediction to achieve complementary advantages. Experiments on real-world datasets across 10 domains demonstrate significant improvements over existing methods, validating the effectiveness of our approach in the utilization of text. The code is made available at https://github.com/decisionintelligence/VoT.

研究の動機と目的

  • イベント駆動ダイナミクスを扱うためにテキスト情報を取り入れる必要性を動機づける。
  • 外生テキストと内生テキストを時系列データと融合する dual-branch VoT アーキテクチャを提案する。
  • 歴史的インコンテキスト学習を用いたイベント駆動推論を開発し、予測をLLMに導く。
  • 表現レベルと予測レベルのアライメントを導入し、クロスモーダル統合を最大化する。
  • 多様な領域での最先端性能を示し、アブレーション分析を提供する。

提案手法

  • 外生テキストと内生テキストを組み込む時系列予測のデュアルブランチアーキテクチャ。
  • テンプレート生成、要約、Reasoner を含むイベント駆動推論パイプライン、Historical In-Context Learning (HIC) によって強化。
  • Endogenous Text Alignment (ETA) により、分解したパターン抽出と分解対照学習を用いて、時系列パターンとテキスト表現を整列。
  • Adaptive Frequency Fusion (AFF) により、イベント駆動予測と数値予測の周波数成分を学習可能な周波数認識ウェイトで統合。
  • 時系列監視、クロスモーダルアライメント、最終融合損失を組み合わせた複合訓練目的関数。
  • データセット全体のアブレーションと外生テキスト対内生テキストの影響分析。

実験結果

リサーチクエスチョン

  • RQ1外生テキストと内生テキストをどのように効果的に活用して時系列予測を改善できるか。
  • RQ2クロスモーダルアライメントと推論を最適化するメカニズム(HIC、ETA、AFF)は何か。
  • RQ3イベント駆動の説明がさまざまな領域で測定可能な利得をもたらすか。
  • RQ4テキストのみ、時系列のみ、または多モーダル使用時に比べてマルチレベルアライメントが性能にどう影響するか。

主な発見

カテゴリモデルMSEMAE
AgricultureVoT0.2090.302
ClimateVoT1.0780.840
EconomyVoT0.2010.353
EnergyVoT0.2220.343
EnvironmentVoT0.2680.380
HealthVoT1.2050.714
SecurityVoT70.1173.937
Social GoodVoT0.8040.389
TrafficVoT0.1690.232
WeatherVoT0.9680.706
  • VoT はほぼすべてのデータセットで最良の性能を達成し、すべての20指標で時系列のみ・テキスト強化ベースラインに対して1位、マルチモーダルベースラインに対しても19/20指標でトップ。
  • HIC を伴う外生テキスト駆動のイベント推論は顕著な利得を提供し、ETAまたはHICを除去した場合に性能が低下することをアブレーションで示唆。
  • Endogenous Text Alignment (ETA) は、トレンド成分と季節成分を分解してテキスト表現と整列させることで表現レベルのクロスモーダルアライメントを改善。
  • Adaptive Frequency Fusion (AFF) はイベント駆動予測と数値予測の周波数成分を動的に統合し、固定的な融合ベースラインを上回る。
  • 外生テキストの寄与はランダムや内生テキストベースの代替より優れており、イベント駆動予測における実世界情報の価値を示す。
  • MM-TSFLib と Weather データセットを含む10の実世界ドメインでの広範な実験により、広範な有効性とロバスト性を実証。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。