QUICK REVIEW
[論文レビュー] Employee Attrition Prediction
Rahul Yedida, Rahul Reddy|arXiv (Cornell University)|Jun 19, 2018
AI and HR Technologies参考文献 6被引用数 26
ひとこと要約
本論文では、業績評価、月間労働時間、勤務年数などの特徴量を用いて従業員の離職を予測するk-Nearest Neighbors(k-NN)モデルを提案する。データセットの70%を訓練用、残りの30%をテスト用に使用したところ、モデルは94.32%の正確性を達成し、人事分析への応用において優れた予測性能を示した。
ABSTRACT
We aim to predict whether an employee of a company will leave or not, using the k-Nearest Neighbors algorithm. We use evaluation of employee performance, average monthly hours at work and number of years spent in the company, among others, as our features. Other approaches to this problem include the use of ANNs, decision trees and logistic regression. The dataset was split, using 70% for training the algorithm and 30% for testing it, achieving an accuracy of 94.32%.
研究の動機と目的
- 企業内の従業員が離職するかどうかを予測する機械学習モデルを開発すること。
- k-Nearest Neighborsアルゴリズムが従業員離職予測において効果的であるかを評価すること。
- 業績評価、月間労働時間、会社在籍年数といった実世界の人事指標を予測特徴量として使用すること。
- この文脈においてk-NN手法と、アーティフィシャルニューラルネットワーク(ANN)、決定木、ロジスティック回帰などの他のモデルを比較すること。
- 実務的な人事意思決定に役立つ高い予測正確性を達成すること。
提案手法
- k-Nearest Neighborsアルゴリズムを用いて、従業員が離職する可能性があるか、それとも留まるかを分類した。
- 特徴量には、業績評価スコア、平均月間労働時間、勤務年数が含まれた。
- データセットは、70%を訓練用、30%をテスト用に分割した。
- モデルのパフォーマンスは、標準的な分類正確性指標を用いて評価された。
- k-NNモデルは、人事データに見られる非線形関係を扱えることから選択された。
- 抽象化の段階で、特徴量スケーリングやハイパーパrameterチューニングの詳細は提供されていない。
実験結果
リサーチクエスチョン
- RQ1k-Nearest Neighborsアルゴリズムは、一般的な人事指標を用いて従業員の離職を効果的に予測できるか?
- RQ2このタスクにおいて、k-NNモデルの正確性は、他の既存の機械学習モデルと比べてどうか?
- RQ3業績評価や勤務年数といった特徴量が、離職予測に与える影響は何か?
- RQ470/30の訓練・テスト分割は、この文脈においてモデルの一般化性能を信頼できるものとして推定できるか?
- RQ5k-NNのような単純で解釈可能なモデルが、より複雑なモデルを上回る性能を発揮できるか?
主な発見
- k-Nearest Neighborsモデルは、テストセットで94.32%の分類正確性を達成した。
- モデルは、業績評価や勤務年数といった、少数の主要な人事特徴量のみを用いても強力な性能を示した。
- 70/30の訓練・テスト分割設定は、モデルパフォーマンスの妥当性を検証するのに効果的であった。
- 結果から、k-NNは従業員離職予測のための実用的で正確なアプローチであることが示唆された。
- 本研究は、伝統的な機械学習モデルが人事分析タスクにおいて高い正確性を達成できることを確認した。
- 提示された正確性から、ロジスティック回帰や意思決定ツリーといったベースライン手法よりも、モデルの性能が優れていることが示唆された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。