[論文レビュー] Longitudinal Risk Prediction in Mammography with Privileged History Distillation
論文は Privileged History Distillation (PHD) を提案し、推論時に現在のマンモグラムのみを用いながら、訓練時に horizon-specific の教師を通じて全履歴の longitudinal signals を蒸留することで、長期のリスク予測を実現する。
Breast cancer remains a leading cause of cancer-related mortality worldwide. Longitudinal mammography risk prediction models improve multi-year breast cancer risk prediction based on prior screening exams. However, in real-world clinical practice, longitudinal histories are often incomplete, irregular, or unavailable due to missed screenings, first-time examinations, heterogeneous acquisition schedules, or archival constraints. The absence of prior exams degrades the performance of longitudinal risk models and limits their practical applicability. While substantial longitudinal history is available during training, prior exams are commonly absent at test time. In this paper, we address missing history at inference time and propose a longitudinal risk prediction method that uses mammography history as privileged information during training and distills its prognostic value into a student model that only requires the current exam at inference time. The key idea is a privileged multi-teacher distillation scheme with horizon-specific teachers: each teacher is trained on the full longitudinal history to specialize in one prediction horizon, while the student receives only a reconstructed history derived from the current exam. This allows the student to inherit horizon-dependent longitudinal risk cues without requiring prior screening exams at deployment. Our new Privileged History Distillation (PHD) method is validated on a large longitudinal mammography dataset with multi-year cancer outcomes, CSAW-CC, comparing full-history and no-history baselines to their distilled counterparts. Using time-dependent AUC across horizons, our privileged history distillation method markedly improves the performance of long-horizon prediction over no-history models and is comparable to that of full-history models, while using only the current exam at inference time.
研究の動機と目的
- デプロイ時に検査 missed や 初回検査のため longitudinal history が利用できないギャップに対応する。
- 全履歴の長期履歴を privileged information として活用する訓練フレームワークを開発する。
- 現在の検査のみで multi-year リスクを予測する student モデルを、 reconstructed history を用いて作成する。
- multi-teacher distillation を通じて horizon-specific の長期リスク手掛かりを transfer する。
- CSA W-CC データセットで no-history 推論時の長期的な性能向上を示す。
提案手法
- 凍結された Mirai ベースの画像エンコーダを用いて各マンモグラムを visit embeddings にエンコードする。
- history prediction module を用いて現在の検査から欠損した歴史的埋め込みを予測する。
- 現在値 + reconstructed history から成るシーケンスを longitudinal encoder と additive hazard head で統合し multi-year リスクを予測する。
- full history に対する horizon-specific teacher expert を訓練し、 reconstructed history で動作する student に logits を蒸留する。
- horizon-wise RCE loss と KL ベースの logit 蒸留を、調整可能な重み λ_l で併用する。
- Adam と cosin 学習率スケジューリングを用いて end-to-end 最適化する。

実験結果
リサーチクエスチョン
- RQ1全履歴から学習した longitudinal risk signals を、推論時に現在の検査のみを用いるモデルへ転移できるか。
- RQ2 horizon-specific の teacher が no-history 推論時の長期予測を改善するか。
- RQ3 Privileged History Distillation が 1–5 年の horizon で full-history および no-history のベースラインと比較してどのように性能を影響するか。
主な発見
| Model | #H | 1y AUC | 2y AUC | 3y AUC | 4y AUC | 5y AUC | 1y pAUC | 2y pAUC | 3y pAUC | 4y pAUC | 5y pAUC |
|---|---|---|---|---|---|---|---|---|---|---|---|
| LoMaR | 4 | 0.914 ±0.023 | 0.865 ±0.020 | 0.851 ±0.017 | 0.841 ±0.019 | 0.851 ±0.016 | 0.817 ±0.023 | 0.749 ±0.020 | 0.738 ±0.018 | 0.731 ±0.018 | 0.740 ±0.018 |
| VMRA | 4 | 0.920 ±0.019 | 0.868 ±0.020 | 0.851 ±0.017 | 0.842 ±0.017 | 0.851 ±0.017 | 0.822 ±0.020 | 0.752 ±0.020 | 0.736 ±0.018 | 0.728 ±0.019 | 0.745 ±0.021 |
| Mirai | 0 | 0.924 ±0.020 | 0.872 ±0.016 | 0.853 ±0.015 | 0.837 ±0.014 | 0.829 ±0.015 | 0.824 ±0.023 | 0.753 ±0.019 | 0.735 ±0.018 | 0.715 ±0.018 | 0.711 ±0.021 |
| LoMaR+PHD | 0 | 0.913 ±0.022 | 0.865 ±0.019 | 0.852 ±0.016 | 0.845 ±0.015 | 0.853 ±0.015 | 0.810 ±0.031 | 0.744 ±0.024 | 0.734 ±0.015 | 0.735 ±0.020 | 0.752 ±0.019 |
| VMRA+PHD | 0 | 0.920 ±0.018 | 0.869 ±0.018 | 0.852 ±0.016 | 0.847 ±0.015 | 0.855 ±0.017 | 0.818 ±0.020 | 0.749 ±0.017 | 0.733 ±0.017 | 0.734 ±0.017 | 0.757 ±0.018 |
- PHD ベースのモデル(LoMaR+PHD および VMRA+PHD)は、履歴が利用不可の場合の性能低下を抑え、full-history モデルに近づく、または同等となる。
- horizon をまたいで見ると、蒸留モデルは長期 horizon(4–5 年)および低 FPR レジームでより大きな改善を示す。
- マルチ-teacher 蒸留(5 教師)は horizon-specific の改善を最も促進し、特に 5 年 horizon で顕著。
- no-history ベースラインと比較して、VMRA+PHD および LoMaR+PHD は 4–5 年予測で全体的な AUC および pAUC が高い。
- アブレーション実験では horizon-aligned 蒸留が重要であり、KD を除去したり教師数を減らすと改善が減少する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。