Skip to main content
QUICK REVIEW

[論文レビュー] Predicting Labor Shortages from Labor Demand and Labor Supply Data: A Machine Learning Approach.

Nikolas Dawson, Marian-Andrei Rizoiu|arXiv (Cornell University)|Apr 3, 2020
Labor market dynamics and wage inequality参考文献 25被引用数 1
ひとこと要約

本研究では、2012年から2018年までの期間にわたり、130万件の求人広告から得られる労働需要(労働需要)と20の公式労働力指標から得られる労働供給(労働供給)データを統合し、132のオーストラリアの職業における年間労働力不足を予測するXGBoost機械学習モデルを開発した。このモデルは、最大で86%のマクロF1スコアを達成し、求人広告データが労働力不足の変化を予測する上で最も予測能の高い特徴であることが明らかになった。

ABSTRACT

This research develops a Machine Learning approach able to predict labor shortages for occupations. We compile a unique dataset that incorporates both Labor Demand and Labor Supply occupational data in Australia from 2012 to 2018. This includes data from 1.3 million job advertisements (ads) and 20 official labor force measures. We use these data as explanatory variables and leverage the XGBoost classifier to predict yearly labor shortage classifications for 132 standardized occupations. The models we construct achieve macro-F1 average performance scores of up to 86 per cent. However, the more significant findings concern the class of features which are most predictive of labor shortage changes. Our results show that job ads data were the most predictive features for predicting year-to-year labor shortage changes for occupations. These findings are significant because they highlight the predictive value of job ads data when they are used as proxies for Labor Demand, and incorporated into labor market prediction models. This research provides a robust framework for predicting labor shortages, and their changes, and has the potential to assist policy-makers and businesses responsible for preparing labor markets for the future of work.

研究の動機と目的

  • オーストラリア労働市場における労働力不足を予測するための機械学習フレームワークの開発。
  • 包括的な予測のため、求人広告による労働需要と公式労働力指標による労働供給の両方のデータ統合。
  • 年次的な労働力不足の変化を予測する際の、異なるデータタイプの予測性能の評価。
  • 労働力不足動態を予測する上で、どのデータ特徴が最も情報量が多いかの特定。

提案手法

  • 2012年から2018年までの期間にわたり、130万件の求人広告と20の公式労働力指標を統合した独自のデータセットの構築。
  • 132の標準化された職業について、年次的な労働力不足分類を予測するXGBoost分類器の使用。
  • 求人広告の件数、頻度、特徴を表現するための特徴工学的手法の採用。
  • 不均衡なクラスの労働力不足結果に対するモデル性能の評価のため、マクロF1スコアの適用。
  • 労働需要および労働供給変数の予測能をランク付けするための特徴重要度分析。
  • 年次的な変化を予測するための時間的モデリングとして、労働力不足状態の年次シフトの予測。

実験結果

リサーチクエスチョン

  • RQ1求人広告データと労働供給データを用いた機械学習モデルは、標準化された職業における年次的労働力不足を効果的に予測できるか?
  • RQ2求人広告データは、公式の労働供給指標と比較して、労働力不足を予測する上で予測能が優れているか?
  • RQ3労働需要と労働供給の特徴のうち、どの側面が労働力不足状態の変化を予測する上で相対的に寄与しているか?
  • RQ4求人広告データは、実時間の労働需要を代替する信頼できる指標として、労働市場の予測モデルに活用できるか?

主な発見

  • XGBoostモデルは最大で86%のマクロF1スコアを達成し、職業ごとの労働力不足予測において優れた性能を示した。
  • 求人広告データが、年次的な労働力不足の変化を予測する上で、最も予測能の高い特徴セットであることが特定された。
  • 求人広告データの高い予測能は、労働市場モデリングにおいて、実時間の労働需要の代替指標としての価値を裏付けている。
  • 労働供給指標は情報量に富んでいるものの、求人広告から導出される労働需要指標に比べて、予測性能への寄与はやや低かった。
  • モデルは、労働力不足状態の動的なシフトを的確に捉えており、将来志向の政策立案や計画立案における実用性を示した。
  • 特徴重要度分析の結果、求人広告の件数と頻度が、不足状態の変化を予測する精度の主な駆動要因であることが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。