Skip to main content
QUICK REVIEW

[논문 리뷰] Data Mining: A Prediction for Performance Improvement of Engineering Students using Classification

Surjeet Kumar Yadav, Saurabh Pal|arXiv (Cornell University)|2012. 03. 17.
Online Learning and Analytics참고 문헌 12인용 수 148
한 줄 요약

이 논문은 분류 알고리즘인 C4.5, ID3, CART를 사용한 데이터 마이닝 접근법을 제안하여 기초 시험 성적과 같은 초기 학업 지표를 기반으로 기계공학 전공 학생들의 기말 시험 성취도를 예측하고 위험에 처한 학생들을 조기에 특정하여 간병할 수 있도록 한다. 이전 학업 데이터를 분석함으로써 모델은 합격/불합격 결과를 정확하게 예측할 수 있었으며, 이는 후속 세션 동안 학생 성취도 향상에 기여하는 대상별 지원을 가능하게 하였다.

ABSTRACT

Now-a-days the amount of data stored in educational database increasing rapidly. These databases contain hidden information for improvement of students' performance. Educational data mining is used to study the data available in the educational field and bring out the hidden knowledge from it. Classification methods like decision trees, Bayesian network etc can be applied on the educational data for predicting the student's performance in examination. This prediction will help to identify the weak students and help them to score better marks. The C4.5, ID3 and CART decision tree algorithms are applied on engineering student's data to predict their performance in the final exam. The outcome of the decision tree predicted the number of students who are likely to pass, fail or promoted to next year. The results provide steps to improve the performance of the students who were predicted to fail or promoted. After the declaration of the results in the final examination the marks obtained by the students are fed into the system and the results were analyzed for the next session. The comparative analysis of the results states that the prediction has helped the weaker students to improve and brought out betterment in the result.

연구 동기 및 목표

  • 기말 시험 이전에 위험에 처한 공학 전공 학생들을 데이터 마이닝 기법을 통해 식별하기 위해.
  • 교육 데이터에 분류 알고리즘을 적용하여 학생 성취도를 예측하기 위해.
  • 약한 성취자를 조기에 식별함으로써 학생 성취도 향상을 위한 실질적인 통찰을 제공하기 위해.
  • 예측 모델의 효과성을 평가하여 시간이 지남에 따라 학업 성취도 향상에 기여하는지 확인하기 위해.
  • 교육 기관이 학생 성공을 위해 데이터 기반 간병 전략을 구현하는 데 지원하기 위해.

제안 방법

  • 기존 학업 데이터를 기반으로 학생 성취도를 분류하기 위해 C4.5, ID3, CART 의사결정 트리 알고리즘을 적용함.
  • 내부 시험 점수, 출석률, 과제 성과와 같은 특징을 입력 예측 변수로 사용함.
  • 기말 시험 결과를 합격, 불합격, 진학으로 분류하기 위해 시험 이전 데이터로 모델을 훈련함.
  • 표준 분류 평가 지표(비교 분석에 암시됨)를 사용하여 모델 성능을 평가함.
  • 모델 개선 및 종단적 분석을 위해 기말 시험 결과를 시스템에 통합함.
  • 예측 결과와 실제 결과 간의 비교 분석을 통해 모델 효과성 검증함.

실험 결과

연구 질문

  • RQ1분류 알고리즘이 초기 학업 지표를 기반으로 공학 전공 학생들의 기말 시험 성취도를 정확하게 예측할 수 있는가?
  • RQ2C4.5, ID3, CART는 합격, 불합격, 진학과 같은 학생 성취도를 분류하는 데 얼마나 효과적인가?
  • RQ3예측 모델링을 통해 위험에 처한 학생들을 조기에 식별하고 성취도를 향상시킬 수 있는 정도는 어느 정도인가?
  • RQ4예측 분석을 사용할 경우 학업 세션 간에 학생 성취도 향상이 측정 가능한가?
  • RQ5실제 결과에서의 피드백은 예측 모델의 정확성과 활용도를 어떻게 향상시키는가?

주요 결과

  • 의사결정 트리 모델은 합격, 불합격, 다음 해로 진학할 학생 수를 성공적으로 예측함.
  • 비교 분석 결과, 예측 모델이 후속 학업 세션에서 학생 성취도 향상에 기여함.
  • 예측을 통해 위험에 처한 것으로 식별된 학생들은 대상별 지원을 통해 성취도를 향상시킴.
  • 기말 시험 결과를 후속 모델 개선 및 종단적 분석에 통합함으로써 시스템은 종단적 효과성을 입증함.
  • C4.5, ID3, CART의 사용은 학업 성취도 예측에 신뢰할 수 있는 분류 결과를 제공함.
  • 본 연구는 데이터 마이닝 기법이 공학 교육에서 사전적 학업 간병을 지원할 수 있음을 확인함.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.