[논문 리뷰] Predicting Labor Shortages from Labor Demand and Labor Supply Data: A Machine Learning Approach.
이 연구는 2012~2018년 동안 132개의 호주 직업에 대해 연간 노동력 부족을 예측하기 위해 노동 수요(130만 건의 구인 광고에서 유래)와 노동 공급(20개의 공식 노동력 측정치) 데이터를 통합한 XGBoost 기계학습 모델을 개발한다. 이 모델은 최대 86%의 매크로-F1 성능을 기록했으며, 구인 광고 데이터가 노동력 부족 변화를 예측하는 데 가장 유용한 특징으로 드러났다.
This research develops a Machine Learning approach able to predict labor shortages for occupations. We compile a unique dataset that incorporates both Labor Demand and Labor Supply occupational data in Australia from 2012 to 2018. This includes data from 1.3 million job advertisements (ads) and 20 official labor force measures. We use these data as explanatory variables and leverage the XGBoost classifier to predict yearly labor shortage classifications for 132 standardized occupations. The models we construct achieve macro-F1 average performance scores of up to 86 per cent. However, the more significant findings concern the class of features which are most predictive of labor shortage changes. Our results show that job ads data were the most predictive features for predicting year-to-year labor shortage changes for occupations. These findings are significant because they highlight the predictive value of job ads data when they are used as proxies for Labor Demand, and incorporated into labor market prediction models. This research provides a robust framework for predicting labor shortages, and their changes, and has the potential to assist policy-makers and businesses responsible for preparing labor markets for the future of work.
연구 동기 및 목표
- 호주의 노동시장에서 노동력 부족을 예측하기 위한 기계학습 프레임워크를 개발하기 위해.
- 포괄적인 예측을 위해 노동 수요(구인 광고를 통한)와 노동 공급(공식 노동력 측정치를 통한) 데이터를 통합하기 위해.
- 노동력 부족의 연간 변화를 예측하는 데 있어 다양한 데이터 유형의 예측 성능를 평가하기 위해.
- 노동력 부족 동적 변화를 예측하는 데 가장 정보를 주는 데이터 특징을 특정하기 위해.
제안 방법
- 2012년부터 2018년까지 130만 건의 구인 광고와 20개의 공식 노동력 측정치를 통합한 고유한 데이터셋 구축.
- 132개의 표준화된 직업에 대해 연간 노동력 부족 분류를 예측하기 위해 XGBoost 분류기 사용.
- 구인 광고의 수량, 빈도 및 특성 등을 통해 노동 수요를 표현하기 위한 특징 공학 적용.
- 노동력 부족 결과의 불균형한 클래스 간 성능 평가를 위해 매크로-F1 스코어 적용.
- 노동 수요 및 노동 공급 변수의 예측 능력을 순위 매기기 위한 특징 중요도 분석.
- 노동력 부족 상태의 연간 변화를 예측함으로써 시간적 모델링을 통한 노동력 부족 변화 분석.
실험 결과
연구 질문
- RQ1노동 수요 및 공급 데이터를 활용하여 표준화된 직업에 대해 연간 노동력 부족을 효과적으로 예측할 수 있는 기계학습 모델이 존재하는가?
- RQ2노동력 부족을 예측하는 데 있어 구인 광고 데이터의 예측 능력은 공식 노동 공급 측정치보다 어떻게 비교되는가?
- RQ3노동 수요와 노동 공급 특징 중 어느 쪽이 노동력 부족 상태 변화를 예측하는 데 더 큰 기여를 하는가?
- RQ4구인 광고는 실시간 노동 수요의 신뢰할 수 있는 대체 지표로 노동시장 예측 모델에 활용될 수 있는가?
주요 결과
- XGBoost 모델은 최대 86%의 매크로-F1 스코어를 기록하여 다양한 직업에서의 노동력 부족 예측에 강력한 성능을 보였다.
- 구인 광고 데이터는 연간 노동력 부족 변화를 예측하는 데 가장 예측 능력이 높은 특징 세트로 규명되었다.
- 구인 광고 데이터의 예측 능력은 노동시장 모델링에서 실시간 노동 수요의 대체 지표로서의 가치를 입증한다.
- 노동 공급 측정치는 정보를 제공하지만, 구인 광고에서 유도된 노동 수요 지표에 비해 예측 성능 기여도가 낮았다.
- 모델은 노동력 부족 상태의 동적 변화를 성공적으로 포착하여 향후 정책 수립 및 계획 수립에 실용적인 활용 가능성을 보였다.
- 특징 중요도 분석 결과, 구인 광고의 수량과 빈도가 부족 변화 예측 정확도의 주요 결정 요소로 드러났다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.