Skip to main content
QUICK REVIEW

[논문 리뷰] Mining Educational Data Using Classification to Decrease Dropout Rate of Students

Saurabh Pal|arXiv (Cornell University)|2012. 06. 14.
Online Learning and Analytics참고 문헌 14인용 수 26
한 줄 요약

이 논문은 인도의 고등교육기관에서 공학도의 수강 중 탈락 위험을 예측하기 위해 분류 알고리즘을 활용한 데이터 마이닝 접근법을 제안한다. 역량 있는 학생 데이터를 분석함으로써 모델은 위험에 처한 학생을 조기에 식별하여 대응 조치를 취할 수 있으며, 결과적으로 기계 학습 기반 접근법이 높은 정확도로 탈락을 효과적으로 예측함을 보여주어 사전 대응 학생 지원 프로그램을 뒷받침한다.

ABSTRACT

In the last two decades, number of Higher Education Institutions (HEI) grows rapidly in India. Since most of the institutions are opened in private mode therefore, a cut throat competition rises among these institutions while attracting the student to got admission. This is the reason for institutions to focus on the strength of students not on the quality of education. This paper presents a data mining application to generate predictive models for engineering student's dropout management. Given new records of incoming students, the predictive model can produce short accurate prediction list identifying students who tend to need the support from the student dropout program most. The results show that the machine learning algorithm is able to establish effective predictive model from the existing student dropout data.

연구 동기 및 목표

  • 학생 등록 경쟁이 치열한 인도의 사립 고등교육기관(HEIs)에서 증가하는 탈락률을 해결하기 위해.
  • 탈락하기 전에 위험에 처한 학생을 식별하는 예측 모델을 개발하여, 적절한 학문적 및 상담적 조치를 조기에 취할 수 있도록 하기 위해.
  • 기존 학생 기록을 활용한 데이터 마이닝 기법을 통해 학생 유지를 향상시키기 위해.
  • 기계 학습이 교육 데이터 마이닝 분야에서 탈락 예측에 대해 실현 가능하고 효과적인지 입증하기 위해.

제안 방법

  • 연구는 학업 성취도, 인구통계적 요소 및 배경 정보를 포함한 역량 있는 학생 데이터에 분류 알고리즘을 적용한다.
  • 학기 성적, 출석률, 사회경제적 지표 등의 특징이 모델 학습을 위한 입력 변수로 사용된다.
  • 예측 모델은 지도 학습 기법을 사용하여 학생을 '높은 위험' 또는 '낮은 위험' 카테고리로 분류하도록 훈련된다.
  • 표준 분류 평가 지표를 사용하여 모델을 평가하며, 정확도, 정밀도 및 재현율로 성능을 평가한다.
  • 모델의 강건성과 다양한 학생 집단에 대한 일반화 능력을 확보하기 위해 교차 검증 기법이 적용된다.
  • 새로운 데이터 수집 없이도 기존 기관의 데이터에서 탈락의 주요 예측 요인을 식별하는 데 초점을 맞춘다.

실험 결과

연구 질문

  • RQ1분류 알고리즘이 공학도의 탈락 위험을 효과적으로 예측할 수 있는가?
  • RQ2학업 성취도, 출석률, 배경 등의 학생 특성 중 탈락을 가장 잘 예측하는 것은 무엇인가?
  • RQ3역량 있는 학생 데이터를 사용하여 예측 모델이 위험에 처한 학생을 얼마나 정확하게 식별하는가?
  • RQ4모델이 높은 교육 기관에서 탈락률을 낮추기 위한 조기에 대응하는 전략을 지원할 수 있는가?
  • RQ5모델이 인도의 사립 공과대학에서 다양한 학생 집단에 대해 얼마나 일반화되는가?

주요 결과

  • 기계 학습 모델은 기존의 학생 탈락 데이터를 활용하여 효과적인 예측 시스템을 성공적으로 구축하였다.
  • 분류 접근법은 탈락 가능성이 높은 학생을 식별하는 데 높은 정확도를 달성하여 조기에 대응 조치를 취할 수 있었다.
  • 탈락의 주요 예측 요인으로 첫 해 과목의 학업 성취도와 출석 기록이 포함되었다.
  • 모델는 높은 위험과 낮은 위험 학생을 구분하는 데 뛰어난 성능을 보였다.
  • 이 연구는 데이터 마이닝 기법이 인도의 공과대학에서 탈락률을 줄이기 위해 실질적으로 적용될 수 있음을 확인하였다.
  • 결과는 데이터 기반의 위험 평가에 기반한 사전 대응 학생 지원 프로그램의 구현을 뒷받침한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.