[論文レビュー] Distributional Fitting and Tail Analysis of Lead-Time Compositions: Nights vs. Revenue on Airbnb
要約: 本論文は Airbnb における Nights Booked(泊数)と Gross Booking Value(収益)の日次リードタイム成分を組成ベクトルとして分析し、中レンジのリードタイムが GBV を支配し、Gamma/Weibull がよく適合し、尾部推定は切り捨てに敏感であると結論付ける。
We analyze daily lead-time distributions for two Airbnb demand metrics, Nights Booked (volume) and Gross Booking Value (revenue), treating each day's allocation across 0-365 days as a compositional vector. The data span 2,557 days from January 2019 through December 2025 in a large North American region. Three findings emerge. First, GBV concentrates more heavily in mid-range horizons: beyond 90 days, GBV tail mass typically exceeds Nights by 20-50%, with ratios reaching 75% at the 180-day threshold during peak seasons. Second, Gamma and Weibull distributions fit comparably well under interval-censored cross-entropy. Gamma wins on 61% of days for Nights and 52% for GBV, with Weibull close behind at 38% and 45%. Lognormal rarely wins (<3%). Nonparametric GAMs achieve 18-80x lower CRPS but sacrifice interpretability. Third, generalized Pareto fits suggest bounded tails for both metrics at thresholds below 150 days, though this may partly reflect right-truncation at 365 days; above 150 days, estimates destabilize. Bai-Perron tests with HAC standard errors identify five structural breaks in the Wasserstein distance series, with early breaks coinciding with COVID-19 disruptions. The results show that volume and revenue lead-time shapes diverge systematically, that simple two-parameter distributions capture daily pmfs adequately, and that tail inference requires care near truncation boundaries.
研究の動機と目的
- Airbnb においてボリューム( Nights)と収益(GBV)のリードタイム分布が異なるかを調査する。
- 区間検閲の下で日次リードタイムの離散確率質量関数に最も適合するパラメトリック族を同定する。
- リードタイム分布の尾部挙動と時系列にわたる潜在的な構造変化を評価する。
- リードタイム分布のフィッティングにおける非パラメトリックとパラメトリック手法を比較し、予測関連のスコアリングを比較する。
- 切り捨て制約の下での収益予測と尾部推定への影響を検討する。
提案手法
- 各日ごとのリードタイム配分を365-単体超多様体上の組成ベクトルとして扱う。
- 日次 Nights と GBV の pmf を Wasserstein-1 距離で比較する。
- 区間検閲された pmf に Gamma, Weibull, および Lognormal 分布を交差エントロピーで適合させる。
- しきい値安定性診断(POT アプローチ)を用いた一般化パレート尾部分析を適用する。
- Wasserstein 距離系列に対して HAC に頑健な Bai–Perron 構造変化検定を用いる。
- CRPS と KLD をスコアリング規則として用いた非パラメトリック GAM フィットを比較する。

実験結果
リサーチクエスチョン
- RQ1日によってボリュームベースのリードタイム分布と収益ベースのリードタイム分布は体系的に異なるか。
- RQ2区間検閲下の日次リードタイム pmf を最も良く説明するパラメトリック族は Gamma, Weibull, Lognormal のどれか。
- RQ3尾部挙動は Nights と GBV でどのように異なり、切り捨てを考慮した閾値の下で尾部は安定しているか。
- RQ4サンプル期間中に Nights と GBV のリードタイム形状の乖離に構造変化は生じるか。
- RQ5記述的な目的と予測志向の目的のために、パラメトリックと非パラメトリック(GAM)フィットの相対的な性能はどうなるか。
主な発見
- 90日を超える領域では GBV が Nights より中レンジの水準に集中し、ピーク期には180日で比率が最大75%に達する。
- Gamma と Weibull は同等の適合を示し、日次で Nights のクロスエントロピーベースの勝率は約55–60%、GBV は約52%。
- Lognormal の優位は稀であり、GAM は CRPS が大幅に低いが解釈性のトレードオフがある。
- GPD 尾部推定は切り捨ての影響により約150日程度で安定性を欠く。これを超える推定は不安定になる。
- Wasserstein 距離には COVID 関連の推移とその後のレジーム変更といった5つの構造的変化が示唆される。
- 記述的リードタイム pmf には二パラメータ Gamma/Weibull で十分であり、 GAM はインサンプルの CRPS が良いがより簡素性に欠ける。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。