[논문 리뷰] simpleKT: A Simple But Tough-to-Beat Baseline for Knowledge Tracing
simpleKT는 Rasch-inspired 접근 방식을 사용해 문제 특정 변이성을 명시적으로 모델링하고, 다양한 데이터셋에서 미래 학생 성적을 예측하기 위해 일반적인 내적(dot-product) 주의(attention)을 사용하는 강력하고 단순한 KT 기준선이다.
Knowledge tracing (KT) is the problem of predicting students' future performance based on their historical interactions with intelligent tutoring systems. Recently, many works present lots of special methods for applying deep neural networks to KT from different perspectives like model architecture, adversarial augmentation and etc., which make the overall algorithm and system become more and more complex. Furthermore, due to the lack of standardized evaluation protocol \citep{liu2022pykt}, there is no widely agreed KT baselines and published experimental comparisons become inconsistent and self-contradictory, i.e., the reported AUC scores of DKT on ASSISTments2009 range from 0.721 to 0.821 \citep{minn2018deep,yeung2018addressing}. Therefore, in this paper, we provide a strong but simple baseline method to deal with the KT task named extsc{simpleKT}. Inspired by the Rasch model in psychometrics, we explicitly model question-specific variations to capture the individual differences among questions covering the same set of knowledge components that are a generalization of terms of concepts or skills needed for learners to accomplish steps in a task or a problem. Furthermore, instead of using sophisticated representations to capture student forgetting behaviors, we use the ordinary dot-product attention function to extract the time-aware information embedded in the student learning interactions. Extensive experiments show that such a simple baseline is able to always rank top 3 in terms of AUC scores and achieve 57 wins, 3 ties and 16 loss against 12 DLKT baseline methods on 7 public datasets of different domains. We believe this work serves as a strong baseline for future KT research. Code is available at \url{https://github.com/pykt-team/pykt-toolkit}\footnote{We merged our model to the extsc{pyKT} benchmark at \url{https://pykt.org/}.}.
연구 동기 및 목표
- 복잡해지는 DLKT 모델 속에서 간단하고 견고한 KT 기준선의 필요성을 제시한다.
- 같은 지식 구성요소(KC) 내에서 문제별 변화를 포착하는 Rasch-inspired 표현을 제안한다.
- 그냥 점곱 주의 네트워크가 경쟁력 있는 지식 상태 예측을 낼 수 있음을 보인다.
- 일반화 가능성을 확립하고 SimpleKT를 강력한 기준선으로 제시하기 위해 7개의 공개 KT 데이터셋에서 평가한다.
제안 방법
- 질문과 그 지식 구성요소(KC)를 Rasch 유사한 질문 난이도 벡터를 사용해 질문-레벨 상호작용을 KC-레벨 상호작용으로 확장해 표현한다.
- 상호작용 표현 x_t와 y_t를 KC 임베딩, 질문 난이도 및 KC 특유의 변 variation의 가법적 조합으로 계산한다.
- 일반적인 점곱 자기 주의(self-attention)를 사용해 과거 상호작용에서 지식 상태 h_{t+1}를 추출한다.
- 2층 피드포워드 네트워크로 지식 상태를 정제하고 이진 교차 엔트로피 손실로 최적화한다.
- 7개 공개 데이터셋에서 표준화된 5-폴드 교차 검증 설정 하에 AUC(주요 지표) 및 정확도(보조 지표)로 평가한다.

실험 결과
연구 질문
- RQ1명시적인 문제 수준 난이도 모델링을 갖춘 간단한 주의 기반 KT 기준선이 다양한 데이터셋에서 최첨단 DLKT 모델과 경쟁할 수 있는가?
- RQ2Rasch-inspired 문제별 조정이 같은 지식 구성요소를 공유하는 문제에 대해 KT 예측을 향상시키는가?
- RQ3평범한 점곱 주의가 KT를 위한 학생 학습 히스토리의 시간 인식 정보를 포착하기에 충분한가?
주요 결과
- simpleKT는 7개 데이터셋에서 AUC 기준으로 상위 3위에 들며 12개 기준선 대비 55승, 3무, 18패를 기록했다.
- 질문과 KC를 모두 포함하는 D1 데이터셋에서 간단kt가 많은 기준선과 비교해 특히 우수한 성능을 보인다.
- SAKT, SAINT, AKT와 비교했을 때 일반적으로 simpleKT는 SAKT와 SAINT보다 우수한 경향이 있으며, AKT는 일부 경우에만 작은 차이를 보인다.
- simpleKT는 DKT, DKT+, DKT-F, KQN 등 여러 딥 시퀀셜 KT 모델보다 여러 데이터셋에서 우수한 성능을 보여 문제 중심 난이도 모델링의 이점을 강조한다.
- 제거 실험에서 문제 난이도 제거(NoDiff)는 D1 데이터셋에서 성능을 크게 떨어뜨리며; 스칼라 난이도(ScalarDiff)는 실제로는 전체 simpleKT와 비슷한 효과를 보인다.
- 메서드는 기억(memory), 적대적 학습(adversarial training), 그래프 구조 없이도 경쟁력이 있어, 단순성과 효과를 강조한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.