QUICK REVIEW
[论文解读] Employee Attrition Prediction
Rahul Yedida, Rahul Reddy|arXiv (Cornell University)|Jun 19, 2018
AI and HR Technologies参考文献 6被引用 26
一句话总结
本文提出了一种k-最近邻(k-NN)模型,利用绩效评估、每月工时和工龄等特征预测员工流失。模型在70%的数据集上进行训练,在30%的数据集上进行测试,准确率达到94.32%,展示了在人力资源分析应用中的强大预测性能。
ABSTRACT
We aim to predict whether an employee of a company will leave or not, using the k-Nearest Neighbors algorithm. We use evaluation of employee performance, average monthly hours at work and number of years spent in the company, among others, as our features. Other approaches to this problem include the use of ANNs, decision trees and logistic regression. The dataset was split, using 70% for training the algorithm and 30% for testing it, achieving an accuracy of 94.32%.
研究动机与目标
- 开发一种机器学习模型,以预测员工是否会离职。
- 评估k-最近邻算法在员工流失预测中的有效性。
- 使用绩效评分、月度工作时长和在职年限等真实世界人力资源指标作为预测特征。
- 在此背景下,将k-NN方法与其他模型(如人工神经网络、决策树和逻辑回归)进行比较。
- 实现高预测准确率,以支持实际的人力资源决策。
提出的方法
- 应用k-最近邻算法对员工是否可能离职或留任进行分类。
- 特征包括绩效评估得分、月平均工作时长和工作年限。
- 将数据集划分为70%用于训练,30%用于测试模型。
- 使用标准分类准确率指标评估模型性能。
- 选择k-NN模型是因其能够处理人力资源数据中的非线性关系。
- 摘要中未提供特征缩放或超参数调优的详细信息。
实验结果
研究问题
- RQ1k-最近邻算法能否有效利用常见人力资源指标预测员工流失?
- RQ2k-NN模型在此任务中的准确率与其他成熟机器学习模型相比如何?
- RQ3绩效评分和工龄等特征对流失预测的影响是什么?
- RQ470/30的训练-测试数据划分是否能可靠估计模型的泛化能力?
- RQ5在员工流失预测中,像k-NN这样简单且可解释的模型是否能优于更复杂的模型?
主要发现
- k-最近邻模型在测试集上实现了94.32%的分类准确率。
- 该模型仅使用少数关键人力资源特征(如绩效评估和工龄)即表现出色。
- 70/30的训练-测试划分配置在验证模型性能方面是有效的。
- 结果表明,k-NN是员工流失预测的一种可行且准确的方法。
- 本研究证实,传统机器学习模型在人力资源分析任务中可实现高准确率。
- 根据所报告的准确率,该模型的性能优于逻辑回归和决策树等基线方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。