Skip to main content
QUICK REVIEW

[논문 리뷰] From Prediction to Application: Language Model-based Code Knowledge Tracing with Domain Adaptive Pre-Training and Automatic Feedback System with Pedagogical Prompting for Comprehensive Programming Education

Unggi Lee, Jiyeong Bae|arXiv (Cornell University)|2024. 01. 01.
Intelligent Tutoring Systems and Adaptive Learning인용 수 1
한 줄 요약

이 논문은 프로그래밍 교육에서 예측 정확도를 향상시키기 위해 도메인 적응형 및 작업 적응형 미사전훈련을 활용하는 언어 모델 기반 접근법인 CodeLKT를 소개한다. CodeLKT는 대규모 언어 모델과 통합되어 구조화된 프롬프트를 사용해 개인화되고 교육학적으로 타당한 피드백을 생성한다. 이 시스템은 기존 모델보다 뚜렷이 뛰어나며, 예측과 응용 사이의 격차를 메우는 실질적인, 맥락 인식 피드백을 가능하게 한다.

ABSTRACT

Knowledge Tracing (KT) is a critical component in online learning, but traditional approaches face limitations in interpretability and cross-domain adaptability. This paper introduces Language Model-based Code Knowledge Tracing (CodeLKT), an innovative application of Language model-based Knowledge Tracing (LKT) to programming education. CodeLKT leverages pre-trained language models to process learning data, demonstrating superior performance over existing KT and Code KT models. We explore Domain Adaptive Pre-Training (DAPT) and Task Adaptive Pre-Training (TAPT), showing enhanced performance in the coding domain and investigating cross-domain transfer between mathematics and coding. Additionally, we present an theoretically-informed integrated system combining CodeLKT with large language models to generate personalized, in-depth feedback to support students' programming learning. This work advances the field of Code Knowledge Tracing by expanding the knowledge base with language model-based approach and offering practical implications for programming education through data-informed feedback.

연구 동기 및 목표

  • 프로그래밍 교육에서 의미적 뉘앙스를 포착하고 도메인 간 전이를 가능하게 하는 전통적 지식 추적(KT) 모델의 한계를 해결하기 위해.
  • 도메인 및 작업 특화 적응을 활용해 사전 훈련된 언어 모델을 활용해 코드 지식 추적(CodeKT)의 예측 정확도를 향상시키기 위해.
  • 자동화된, 교육학적으로 근거가 있는 피드백 생성을 통합한 통합 시스템을 통해 예측 모델링과 실용적 응용 사이의 격차를 해소하기 위해.
  • 언어 모델을 활용해 수학과 프로그래밍 간의 도메인 간 지식 전이를 탐구하기 위해.
  • 학생의 학습 역사와 성과를 바탕으로 맥락 인식형 개인화 지침을 제공하는 교육 이론에 기반한 피드백 시스템을 개발하기 위해.

제안 방법

  • CodeLKT는 학생의 코드 시퀀스를 자연어로 처리하는 언어 모델 기반 아키텍처를 사용하여 코드와 응답의 의미적 및 문법적 패턴을 포착한다.
  • 도메인 적응형 미사전훈련(DAPT)은 기반 언어 모델을 프로그래밍 전용 코퍼스로 미세조정하여 프로그래밍 도메인에서의 성능을 향상시킨다.
  • 작업 적응형 미사전훈련(TAPT)은 CodeKT 전용 데이터로 모델을 추가로 적응시켜 작업 특화 지식 추적 능력을 향상시킨다.
  • 프롬프트 기반 피드백 시스템은 교육학적 프롬프트 템플릿과 구조적 구성 요소(예: 긍정적 피드백, 힌트, 관련 과거 문제)를 사용해 맥락 인식형, 학생별 맞춤 피드백을 생성한다.
  • 피드백 시스템은 CodeLKT의 예측 출력(예: 정확도 확률)을 LLM과 통합하여 정확도 수정, 향상 팁, 다음 과제를 포함한 다성분 피드백을 생성한다.
  • 이 시스템은 이중 단계 프롬프트 프레임워크를 사용한다: 하나는 정답 제출 시 정확도 피드백을 위한 것이고, 다른 하나는 정답이 잘못되었을 때 힌트 피드백을 위한 것으로, 모두 프로그래밍 교육 이론에 기반한다.

실험 결과

연구 질문

  • RQ1CodeLKT는 프로그래밍 학습 과제에서 기존 KT 및 CodeKT 모델과 비교해 예측 정확도 측면에서 어떻게 성능을 내는가?
  • RQ2도메인 적응형 미사전훈련(DAPT)이 프로그래밍 도메인에서 모델 성능을 얼마나 향상시키는가?
  • RQ3언어 모델을 통해 수학에서 프로그래밍으로 지식을 효과적으로 전이할 수 있는가, 그리고 이는 성능에 어떤 영향을 미치는가?
  • RQ4작업 적응형 미사전훈련(TAPT)이 CodeKT 전용 성능 향상에 얼마나 효과적인가?
  • RQ5LLM 기반 피드백 시스템은 학생의 학습을 예측을 넘어서 지원하는 교육학적으로 타당한 개인화 피드백을 효과적으로 생성할 수 있는가?

주요 결과

  • CodeLKT는 프로그래밍 교육 벤치마크에서 기존 KT 및 CodeKT 모델보다 뚜렷이 뛰어난 예측 정확도를 보이며, 뛰어난 성능을 입증한다.
  • 도메인 적응형 미사전훈련(DAPT)은 프로그래밍 전용 과제에서 모델 성능 향상에 명백한 기여를 하며, 도메인 특화 미세조정의 가치를 확인한다.
  • 작업 적응형 미사전훈련(TAPT)은 CodeKT 과제에서 모델 성능을 추가로 향상시켜, 작업 특화 적응이 지식 추적에 효과적임을 시사한다.
  • 언어 모델을 활용해 수학에서 프로그래밍으로의 도메인 간 지식 전이가 가능하며, 이는 STEM 분야 간 공통 기반 모델의 잠재력을 시사한다.
  • 통합된 피드백 시스템은 정확도 수정, 향상 팁, 다음 과제를 포함한 고품질의 개인화 피드백을 생성하며, 정성적 증거를 통해 교육학적으로 타당하고 맥락에 부합하는 피드백임을 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.