Skip to main content
QUICK REVIEW

[論文レビュー] SPRINT: Semi-supervised Prototypical Representation for Few-Shot Class-Incremental Tabular Learning

Umid Suleymanov, Murat Kantarcioglu|arXiv (Cornell University)|Mar 4, 2026
Domain Adaptation and Few-Shot Learning被引用数 0
ひとこと要約

SPRINTは信頼度ベースの擬似ラベリングと混合エピソード学習を用いて、基盤知識を保持しつつ少数ショットおよび unlabeled データから新規クラスを学習する、タブラ型FSCILの半教師ありなプロトタイプネットワークである。多様なタブラ領域において最先端の性能を達成。

ABSTRACT

Real-world systems must continuously adapt to novel concepts from limited data without forgetting previously acquired knowledge. While Few-Shot Class-Incremental Learning (FSCIL) is established in computer vision, its application to tabular domains remains largely unexplored. Unlike images, tabular streams (e.g., logs, sensors) offer abundant unlabeled data, a scarcity of expert annotations and negligible storage costs, features ignored by existing vision-based methods that rely on restrictive buffers. We introduce SPRINT, the first FSCIL framework tailored for tabular distributions. SPRINT introduces a mixed episodic training strategy that leverages confidence-based pseudo-labeling to enrich novel class representations and exploits low storage costs to retain base class history. Extensive evaluation across six diverse benchmarks spanning cybersecurity, healthcare, and ecological domains, demonstrates SPRINT's cross-domain robustness. It achieves a state-of-the-art average accuracy of 77.37% (5-shot), outperforming the strongest incremental baseline by 4.45%.

研究の動機と目的

  • タブラーデータに対するFSCILを基盤メモリの保持とラベルなしデータプールと共に形式化する。
  • unlabeled データから新規クラス表現を豊かにする半教師ありプロトタイプ拡張を開発する。
  • 蒸留なしで基盤リハーサルと新規適応を jointly 最適化する混合エピソディック学習戦略を提案する。
  • 多様なタブラー基準データセットにおけるドメイン横断の頑健性と最先端の精度を実証する。

提案手法

  • ベースセッションのクラスプロトタイプ学習のためにPrototypical Networksを用いたエピソディック学習を実施する。
  • 忘却を防ぐために増分セッション中にエンコーダを維持・更新する。
  • 新規クラスプロトタイプを拡張するために unlabeled データの信頼度ベースの擬似ラベリングを導入する。
  • ラベル付き新規サンプルと高信頼度の擬似ラベル付きサンプルを基盤クラスサンプルと組み合わせて半教師ありエピソードを形成する。
  • 基盤プロトロ_lossと半教師あり損失の加重結合で訓練し、忘却を間接的に抑制する。

実験結果

リサーチクエスチョン

  • RQ1 unlabeledなタブラー数据の半教師付き擬似ラベリングは、基盤クラスの忘却を緩和しつつFew-Shotのクラス順次学習を向上させるか?
  • RQ2基盤リハーサルと半教師あり新規適応を jointly 最適化する混合エピソディック学習は、タブラーデータの既存FSCIL手法を上回るか?
  • RQ3特徴次元数やデータレジームが異なる多様なタブラー領域でSPRINTはどのように性能を発揮するか?
  • RQ4メモリ予算・ショット数・擬似ラベル品質が最終性能と安定性に与える影響はどうなるか?
  • RQ5ユークリッド距離のプロトタイプ的アプローチは、他の距離測度と比べてタブラーFSCILに適しているか?

主な発見

  • SPRINTは多様なタブラー基準データセットで5ショット設定において平均精度77.37%の最先端性能を達成。
  • ACI-IoT-2023データセットで最終忘却0.〜%を抑え、iCaRLなどの強力なベースラインを上回る忘却低減を実現(最終忘却2.54%)。
  • 6データセットにわたり堅牢な性能を示し、最終セッションの精度分布が狭く安定性が高いことを含む堅牢性を示す。
  • アブレーション研究により、基盤リハーサルと半教師ありクラスタリングの組み合わせが最大の利益を生み、プロト_loss単独より顕著に改善。
  • 高次元(MNISTのCNNバックボーン)から低次元のタブラーデータまでスケールし、視覚系FSCIL手法が難しい領域でも良好な性能を維持。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。