Skip to main content
QUICK REVIEW

[论文解读] Data Mining: A Prediction for Performance Improvement of Engineering Students using Classification

Surjeet Kumar Yadav, Saurabh Pal|arXiv (Cornell University)|Mar 17, 2012
Online Learning and Analytics参考文献 12被引用 148
一句话总结

本文提出一种使用分类算法(C4.5、ID3 和 CART)的数据挖掘方法,以预测工程专业学生的期末考试表现,并识别高风险学生以实现早期干预。通过分析历史学业数据,该模型准确预测了通过/未通过的结果,从而实现有针对性的支持,使后续学期的学生表现得到可衡量的提升。

ABSTRACT

Now-a-days the amount of data stored in educational database increasing rapidly. These databases contain hidden information for improvement of students' performance. Educational data mining is used to study the data available in the educational field and bring out the hidden knowledge from it. Classification methods like decision trees, Bayesian network etc can be applied on the educational data for predicting the student's performance in examination. This prediction will help to identify the weak students and help them to score better marks. The C4.5, ID3 and CART decision tree algorithms are applied on engineering student's data to predict their performance in the final exam. The outcome of the decision tree predicted the number of students who are likely to pass, fail or promoted to next year. The results provide steps to improve the performance of the students who were predicted to fail or promoted. After the declaration of the results in the final examination the marks obtained by the students are fed into the system and the results were analyzed for the next session. The comparative analysis of the results states that the prediction has helped the weaker students to improve and brought out betterment in the result.

研究动机与目标

  • 使用数据挖掘技术在期末考试前识别高风险工程专业学生。
  • 在教育数据上应用分类算法以预测学生表现。
  • 为改善学生表现提供可操作的见解,通过早期识别学习能力较弱的学生。
  • 评估预测模型在提升学业表现方面的有效性。
  • 支持教育机构实施以数据为驱动的干预措施,促进学生成功。

提出的方法

  • 应用 C4.5、ID3 和 CART 决策树算法,基于历史学业数据对学生表现进行分类。
  • 使用内部测验成绩、出勤率和作业表现等特征作为输入预测变量。
  • 利用考前数据训练模型,预测期末考试结果为通过、未通过或升班。
  • 使用标准分类指标评估模型性能(由对比分析隐含)。
  • 将考试后的结果整合到系统中,用于模型优化和纵向分析。
  • 通过对比预测结果与实际结果,验证模型的有效性。

实验结果

研究问题

  • RQ1基于早期学业指标,分类算法能否准确预测工程专业学生的期末考试表现?
  • RQ2C4.5、ID3 和 CART 在对学生表现结果(如通过、未通过或升班)进行分类方面的有效性如何?
  • RQ3预测建模在多大程度上能够实现对高风险学生的早期识别与改进?
  • RQ4使用预测分析是否能带来学生表现的可衡量提升?
  • RQ5实际结果的反馈在多大程度上提升了预测模型的准确性和实用性?

主要发现

  • 决策树模型成功预测了可能通过、未通过或升班的学生人数。
  • 对比分析表明,预测模型使后续学术学期的学生表现得到改善。
  • 通过预测识别出的高风险学生,在获得针对性支持后表现得以提升。
  • 该系统通过整合考试后结果实现模型优化,展现出长期有效性。
  • C4.5、ID3 和 CART 的使用为学业表现预测提供了可靠的分类结果。
  • 本研究证实,数据挖掘技术可支持工程教育中的主动学业干预。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。