Skip to main content
QUICK REVIEW

[論文レビュー] Forecasting of the Montreal Subway Smart Card Entry Logs with Event Data

Florian Toqué, Étienne Côme|arXiv (Cornell University)|Aug 22, 2020
Human Mobility and Location-Based Analysis被引用数 1
ひとこと要約

本研究では、スマートカードデータ、カレンダーデータ、計画済みイベントデータを用いて、モントリオール地下鉄の乗客需要を最大1年先まで15分間隔で長期予測可能な汎用的なデータ形状化フレームワークを提案する。ランダムフォレストモデルが最も優れた性能を示し、特にイベント中の頻度の低い利用者向けの乗車回数に対して、イベントデータが予測精度を顕著に向上させることを示した。

ABSTRACT

One of the major goals of transport operators is to adapt the transport supply scheduling to the passenger demand for existing transport networks during each specific period. Another problem mentioned by operators is accurately estimating the demand for disposable ticket or pass to adapt ticket availability to passenger demand. In this context, we propose generic data shaping, allowing the use of well-known regression models (basic, statistical and machine learning models) for the long-term forecasting of passenger demand with fine-grained temporal resolution. Specifically, this paper investigates the forecasting until one year ahead of the number of passengers entering each station of a transport network with a quarter-hour aggregation by taking planned events into account (e.g., concerts, shows, and so forth). To compare the models and the quality of the prediction, we use a real smart card and event data set from the city of Montr\'eal, Canada, that span a three-year period with two years for training and one year for testing.

研究の動機と目的

  • 都市交通網における細分化された時間分解能(15分)での乗客需要の長期予測を可能にすること。
  • 標準回帰モデルと組み合わせて利用可能な、スマートカード、カレンダー、イベントデータを統合する汎用的なデータ形状化手法の開発。
  • 需要予測を通じて輸送上の計画とチケットの手配を改善し、特にイベント期間中の異なるチケット種別(特に一時利用チケット)の需要を予測すること。
  • イベントデータが予測精度に与える影響、特に一時利用チケットや一回限りのチケット利用者に対して、その影響を評価すること。
  • 他の都市において同様のデータが入手可能な場合に適用可能な再現性のある手法を提供すること。

提案手法

  • データ形状化により、カレンダーおよびイベントデータを数値特徴量(例:曜日、イベント有無、イベント種別)に変換し、モデルへの入力として利用する。
  • 細分化された需要パターンおよびイベントの影響を捉えるために、15分間隔の時系列集計を実施する。
  • 複数のモデルを比較:基本的(線形)、統計的(SARIMAX)、機械学習(ランダムフォレスト、XGBoost、LightGBM)。
  • トレーニングセットは2年間、テストセットは1年間の実世界データをカバーし、長期予測性能を評価する。
  • 乗客数の年次変化を補正するため、トレンド補正手法を適用する。
  • グローバル予測およびチケット種別別予測の両方において、MAE、RMSE、R²の指標を用いてモデルの性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1事前に入手可能なカレンダーおよびイベントデータのみを用いて、最大1年先の乗客需要を正確に予測できるか?
  • RQ2イベントデータの導入が、特にイベント期間中の予測精度にどのように影響を与えるか?
  • RQ3基本的、統計的、機械学習の各モデルの中で、長期的かつ細分化された地下鉄需要予測に最も優れた性能を示すのはどれか?
  • RQ4イベント中におけるチケット種別(例:一時利用チケット)の需要はどのように変化するか?その変化を予測モデルが捉えることができるか?
  • RQ5トレンド補正手法が長期予測性能をどの程度向上させるか?

主な発見

  • ランダムフォレストモデルが、グローバル需要予測において最も低いMAEおよびRMSEを達成し、統計的および基本的モデルを上回った。
  • イベントデータの導入により、特にイベント期間中の予測精度が顕著に向上した。その影響は、特に一時利用チケットの利用者に対して顕著に見られた。
  • ルシエン・ルアリエール駅では、ピークイベント時間帯(例:22:15)に一時利用チケットを利用した乗客数が最大1,000人まで増加した。
  • 駅ごとの予測性能に差が見られたが、イベント会場に近い駅では、イベントデータを組み込むことで予測がより正確になった。
  • トレンド補正手法は、乗客数の年次増加を効果的に捉え、長期予測の安定性を向上させた。
  • 提案されたデータ形状化フレームワークは汎用的かつ再現可能であり、同様のデータが入手可能な他の交通網への応用が可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。