Skip to main content
QUICK REVIEW

[논문 리뷰] Dual-Criterion Curriculum Learning: Application to Temporal Data

Guy Abel, Eloi Campagne|arXiv (Cornell University)|2026. 03. 24.
Machine Learning and Data Classification인용 수 0
한 줄 요약

듀얼-크리테리온 커리큘럼 러닝(DCCL)을 도입하여 손실 기반 신호와 밀도 기반 난이도 신호를 결합해 커리큘럼을 구성하고, Transformer 기반 다변량 시계열 예측에 대해 평가한 결과 하이브리드 전략이 손실만 또는 비-CL 기초 모델 대비 우수한 성능을 보임.

ABSTRACT

Curriculum Learning (CL) is a meta-learning paradigm that trains a model by feeding the data instances incrementally according to a schedule, which is based on difficulty progression. Defining meaningful difficulty assessment measures is crucial and most usually the main bottleneck for effective learning, while also in many cases the employed heuristics are only application-specific. In this work, we propose the Dual-Criterion Curriculum Learning (DCCL) framework that combines two views of assessing instance-wise difficulty: a loss-based criterion is complemented by a density-based criterion learned in the data representation space. Essentially, DCCL calibrates training-based evidence (loss) under the consideration that data sparseness amplifies the learning difficulty. As a testbed, we choose the time-series forecasting task. We evaluate our framework on multivariate time-series benchmarks under standard One-Pass and Baby-Steps training schedules. Empirical results show the interest of density-based and hybrid dual-criterion curricula over loss-only baselines and standard non-CL training in this setting.

연구 동기 및 목표

  • 커리큘럼 러닝(CL)에서 난이도 평가의 병목 현상을 동기화하고 손실과 데이터 밀도를 함께 고려하는 모듈식 프레임워크를 제안한다.
  • 임베딩 공간에서 표현 기반 밀도 측정치를 개발하여 손실을 보완하는 인스턴스 난이도 점수로 활용한다.
  • 손실과 밀도 기준을 결합하여 커리큘럼 구성에 적용하는 하이브리드 융합 전략을 제안한다.
  • Transformer 기반 예측기를 사용한 다변량 시계열 예측에 DCCL을 적용하고 표준 벤치마크에서 평가한다.
  • -One-Pass 및 Baby-Steps 학습 스케줄 하에서 비-CL, 손실만, 밀도만 커리큘럼과 비교한다.

제안 방법

  • 데이터를 임베딩으로 매핑하는 표현 모델과 인스턴스를 점수화하는 난이도 측정기를 연결한 모듈식 CL 파이프라인을 구축한다.
  • 학습된 표현 공간에서 밀도 추정(k-NN 밀도 또는 커널 밀도 추정)을 순수한 또는 하이브리드 난이도 신호로 사용한다.
  • 예측 손실에서 계산된 손실 기반 난이도 점수를 대안 신호로 사용한다.
  • 손실과 밀도 기준의 가중 합, 순위 가중 합, 2D 손실-밀도 계층화를 통해 K개의 커리큘럼 버킷을 생성하는 하이브리드 융합 전략을 제안한다.
  • 난이도 측정의 효과를 고립하기 위해 학습 스케줄을 고정된 채로 유지한다(One-Pass 및 Baby-Steps).
  • 표현 학습에 이어 커리큘럼 기반 학습을 적용하여 Transformer 예측기를 다섯 개의 다변량 시계열 데이터셋에서 평가한다.

실험 결과

연구 질문

  • RQ1손실 기반과 밀도 기반 난이도 신호를 결합하는 것이 두 가지 기준 중 하나만 사용할 때보다 시계열 예측에 더 강건한 커리큘럼을 만들어내는가?
  • RQ2예측 task에서 더 쉬운 인스턴스와 더 어려운 인스턴스를 반영하기 위해 표현 공간에서 밀도를 어떻게 추정해야 하는가?
  • RQ3Dual-criterion 전략을 사용할 때 One-Pass와 Baby-Steps 커리큘럼 간의 상대적 성능 trade-off는 무엇인가?
  • RQ4비-커리큘럼 학습과 비교했을 때 다양한 시간 도메인(에너지, 기상, 이동성 등)에서 하이브리드 커리큘럼이 일관되게 정확도를 향상시키는가?

주요 결과

데이터셋평균 순위비-커리큘럼무작위STL손실 기반k-NNKDEConvex-valueConvex-ranks그리드
One-Pass • Electricity5.000.486 b1 0.0650.462 b1 0.0590.604 b1 0.0690.399 b1 0.0260.532 b1 0.1010.435 b1 0.0420.502 b1 0.0740.513 b1 0.0250.505 b1 0.039
One-Pass • ETT5.001.005 b1 0.0851.004 b1 0.1590.928 b1 0.1371.051 b1 0.6270.582 b1 0.1590.830 b1 0.1060.129 b1 0.0150.267 b1 0.1880.375 b1 0.108
One-Pass • ILI5.000.865 b1 0.0190.871 b1 0.0430.932 b1 0.0310.946 b1 0.0401.092 b1 0.1910.925 b1 0.0340.862 b1 0.0290.821 b1 0.021
One-Pass • Weather5.000.201 b1 0.0360.196 b1 0.0600.226 b1 0.0710.169 b1 0.0250.169 b1 0.0530.209 b1 0.0230.470 b1 0.0470.177 b1 0.026
One-Pass • Solar AL5.000.080 b1 0.0090.076 b1 0.0070.082 b1 0.0070.103 b1 0.0060.186 b1 0.0220.115 b1 0.0240.074 b1 0.0080.106 b1 0.018
One-Pass • Mean----------
Baby-Steps • Electricity7.000.486 b1 0.0650.505 b1 0.0390.630 b1 0.0980.532 b1 0.0440.507 b1 0.0350.492 b1 0.0490.483 b1 0.0470.513 b1 0.0430.505 b1 0.064
Baby-Steps • ETT5.001.005 b1 0.0850.935 b1 0.1230.914 b1 0.1090.987 b1 0.1320.556 b1 0.1350.969 b1 0.1450.298 b1 0.1430.757 b1 0.3320.847 b1 0.164
Baby-Steps • ILI5.000.865 b1 0.0190.805 b1 0.0430.882 b1 0.0210.831 b1 0.0260.952 b1 0.1100.921 b1 0.0960.874 b1 0.1040.714 b1 0.0180.749 b1 0.032
Baby-Steps • Weather5.000.201 b1 0.0360.196 b1 0.0600.031 b1 0.0160.077 b1 0.0690.029 b1 0.0160.029 b1 0.0080.038 b1 0.0180.029 b1 0.0160.029 b1 0.016
Baby-Steps • Solar AL5.000.080 b1 0.0090.069 b1 0.0050.060 b1 0.0070.066 b1 0.0120.058 b1 0.0070.069 b1 0.0070.060 b1 0.0120.058 b1 0.0070.059 b1 0.007
  • 하이브리드 전략(손실+밀도)이 데이터셋과 스케줄 전반에 걸쳐 가장 강한 집약적 성능을 달성한다.
  • One-Pass 하에서 Grid 및 Convex-value 하이브리드 형식이 평균 순위에서 최상으로 나타나며; Baby-Steps에서는 Grid가 종종 최상위 평균 순위를 차지한다.
  • 밀도 기반 신호가 특정 데이터셋(예: ILI 및 ETT)에서 손실 기반보다 성능이 앞선 경우가 있어 서로 보완적임을 지지한다.
  • Baby-Steps는 일반적으로 쉬운 인스턴스에 대해 모델을 재노출시킴으로써 이득을 증대시키며 대형 데이터셋에서 계산적 트레이드오프가 다르게 나타난다.
  • 순수 손실 기반 커리큘럼은 예열 모델의 보정이 불완전하면 오도될 수 있으며, 밀도 기반 커리큘럼은 학습 동역학을 간과할 수 있다; 융합이 이러한 이슈를 완화한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.