[논문 리뷰] SPRINT: Semi-supervised Prototypical Representation for Few-Shot Class-Incremental Tabular Learning
SPRINT는 표 형식 FSCIL을 위한 반지도 학습 프로토타입 네트워크로, 신뢰도 기반 의사 레이블링과 혼합 에피소드 학습을 사용하여 소량 샘플과 미표기 데이터에서 새로운 클래스를 학습하면서 기본 지식을 보유하고, 다양한 표 형식 도메인에서 최첨단 성능을 달성합니다.
Real-world systems must continuously adapt to novel concepts from limited data without forgetting previously acquired knowledge. While Few-Shot Class-Incremental Learning (FSCIL) is established in computer vision, its application to tabular domains remains largely unexplored. Unlike images, tabular streams (e.g., logs, sensors) offer abundant unlabeled data, a scarcity of expert annotations and negligible storage costs, features ignored by existing vision-based methods that rely on restrictive buffers. We introduce SPRINT, the first FSCIL framework tailored for tabular distributions. SPRINT introduces a mixed episodic training strategy that leverages confidence-based pseudo-labeling to enrich novel class representations and exploits low storage costs to retain base class history. Extensive evaluation across six diverse benchmarks spanning cybersecurity, healthcare, and ecological domains, demonstrates SPRINT's cross-domain robustness. It achieves a state-of-the-art average accuracy of 77.37% (5-shot), outperforming the strongest incremental baseline by 4.45%.
연구 동기 및 목표
- 표 형식 데이터에 대해 기본 메모리 유지와 비표기 데이터 풀을 갖춘 FSCIL을 형식화한다.
- 미표기 데이터로부터 새로운 클래스로의 표현을 풍부하게 하기 위한 반지도 프로토타입 확장을 개발한다.
- 증류 없이 기본 리허설과 새로운 적응을 함께 최적화하는 혼합 에피소드 학습 전략을 제안한다.
- 다양한 표 형식 벤치마크에서 교차 도메인 견고성과 최첨단 정확성을 입증한다.
제안 방법
- 기본 세션에서 Prototypical Networks를 사용한 에피소딕 학습으로 클래스 프로토타입을 학습한다.
- 잊힘을 방지하기 위해 증가 세션 중 인코더를 유지하고 업데이트한다.
- 새로운 클래스타 프로토타입을 보강하기 위해 미표기 데이터의 신뢰도 기반 의사 레이블링을 도입한다.
- 기본 클래스 샘플과 함께 라벨이 지정된 새로운 샘플과 고신뢰도 의사 라벨 샘플을 결합하여 반지도 에피소드를 형성한다.
- 기본 프로토 로스와 반지도 로스의 가중합으로 학습하여 잊힘을 암시적으로 억제한다.
실험 결과
연구 질문
- RQ1비표기 표 데이터의 반지도 의사 레이블링이 기본 클래스의 잊힘을 완화하면서 소수 샘플로 클래스 증가 학습을 향상시킬 수 있는가?
- RQ2기본 리허설과 반지도 새로운 적응을 함께 최적화하는 혼합 에피소딕 학습이 표 데이터의 기존 FSCIL 방법들보다 성능이 우수한가?
- RQ3다양한 특징 차원수와 데이터 규칙을 가진 다양한 표 도메인에서 SPRINT의 성능은 어떠한가?
- RQ4메모리 예산, 샷 수, 의사 레이블 품질이 최종 성능과 안정성에 미치는 영향은 무엇인가?
- RQ5다른 거리 측정과 비교했을 때 유클리드 프로토타입 접근 방식은 표 형식 FSCIL에 적합한가?
주요 결과
- SPRINT는 다양한 표 벤치마크에서 5-shot 설정에서 최첨단 평균 정확도(77.37%)를 달성한다.
- SPRINT는 ACI-IoT-2023 데이터셋에서 최종 잊힘 2.54%로 낮은 잊힘을 달성하여 iCaRL과 같은 강력한 베이스라인을 능가한다.
- 여섯 개 데이터셋에 걸쳐 SPRINT는 강건한 성능을 보이며 최종 세션 정확도 분포가 촘촘해 높은 안정성을 포함한다.
- 의사 실험은 기본 리허설과 반지도 클러스터링을 결합하는 것이 가장 큰 이득을 낳고, 프로토 로스만을 사용하는 것보다 현저한 차이로 더 나은 성능을 보임을 보여준다.
- 이 방법은 고차원(MNIST 및 CNN 백본) 및 저차원 표 데이터에서 스케일링되며, 시각적 FSCIL 방법이 어려움을 겪는 영역에서도 강한 성능을 유지한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.