Skip to main content
QUICK REVIEW

[論文レビュー] Customer Churn Prediction Model using Explainable Machine Learning

Jitendra Maan, Harsh Maan|arXiv (Cornell University)|Mar 2, 2023
Customer churn and segmentation被引用数 8
ひとこと要約

この論文は、 Explainable ML を用いた顧客解約予測モデルを開発し、XGBoost を最も効果的な分類器として特定し、特徴量の重要度を説明する Shapley 値ベースのアプローチを提案しています。

ABSTRACT

It becomes a significant challenge to predict customer behavior and retain an existing customer with the rapid growth of digitization which opens up more opportunities for customers to choose from subscription-based products and services model. Since the cost of acquiring a new customer is five-times higher than retaining an existing customer, henceforth, there is a need to address the customer churn problem which is a major threat across the Industries. Considering direct impact on revenues, companies identify the factors that increases the customer churn rate. Here, key objective of the paper is to develop a unique Customer churn prediction model which can help to predict potential customers who are most likely to churn and such early warnings can help to take corrective measures to retain them. Here, we evaluated and analyzed the performance of various tree-based machine learning approaches and algorithms and identified the Extreme Gradient Boosting XGBOOST Classifier as the most optimal solution to Customer churn problem. To deal with such real-world problems, Paper emphasize the Model interpretability which is an important metric to help customers to understand how Churn Prediction Model is making predictions. In order to improve Model explainability and transparency, paper proposed a novel approach to calculate Shapley values for possible combination of features to explain which features are the most important/relevant features for a model to become highly interpretable, transparent and explainable to potential customers.

研究の動機と目的

  • デジタル化されたサブスクリプション市場における顧客の予測と維持の課題に対処する。
  • 解約予測のための決定木ベースの機械学習モデルを評価し、最も効果的なアプローチを特定する。
  • 予測の解釈性を強調し、利害関係者への説明を支援する。
  • 特徴貢献を説明し透明性を高める新しい Shapley 値ベースの方法を提案する。

提案手法

  • 解約予測のための決定木ベースの機械学習アプローチを比較する。
  • 評価したモデルの中から Extreme Gradient Boosting (XGBoost) を最適な分類器として特定する。
  • モデル予測を説明するための特徴量の組み合わせに対する Shapley 値を計算する新しいアプローチを開発する。
  • 利害関係者が解約予測を理解できるよう、解釈性と透明性に焦点を当てる。

実験結果

リサーチクエスチョン

  • RQ1木ベース手法の中で、解約予測に最も高い性能を示す機械学習モデルはどれか?
  • RQ2潜在的な顧客に対して解約予測の説明性と透明性をどのように高められるか?
  • RQ3Shapley 値ベースの説明によって、解約予測で最も影響力のある特徴はどれか?
  • RQ4Shapley 値ベースのアプローチは、解約モデルの特徴の組み合わせを効果的に説明できるか?

主な発見

  • 解約予測の最適解として XGBoost 分類器を特定した。
  • 予測に対する可能な特徴量の組み合わせの影響を説明するための新しい Shapley 値ベースのアプローチを提案した。
  • この研究は、顧客および利害関係者に解約予測を理解しやすくするために、モデルの解釈性を重視している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。