QUICK REVIEW

[論文レビュー] Analyzing Machine Learning Models for Credit Scoring with Explainable AI and Optimizing Investment Decisions

Swati Tyagi|arXiv (Cornell University)|Sep 19, 2022

Financial Distress and Bankruptcy Prediction被引用数 24

ひとこと要約

この論文はクレジットスコアリングのための複数のMLモデルを比較し、説明性のためにLIMEとSHAPを適用し、説明可能性を高めつつリスクを抑えつつ収益性を最大化するML主導の投資戦略を調査します。

ABSTRACT

This paper examines two different yet related questions related to explainable AI (XAI) practices. Machine learning (ML) is increasingly important in financial services, such as pre-approval, credit underwriting, investments, and various front-end and back-end activities. Machine Learning can automatically detect non-linearities and interactions in training data, facilitating faster and more accurate credit decisions. However, machine learning models are opaque and hard to explain, which are critical elements needed for establishing a reliable technology. The study compares various machine learning models, including single classifiers (logistic regression, decision trees, LDA, QDA), heterogeneous ensembles (AdaBoost, Random Forest), and sequential neural networks. The results indicate that ensemble classifiers and neural networks outperform. In addition, two advanced post-hoc model agnostic explainability techniques - LIME and SHAP are utilized to assess ML-based credit scoring models using the open-access datasets offered by US-based P2P Lending Platform, Lending Club. For this study, we are also using machine learning algorithms to develop new investment models and explore portfolio strategies that can maximize profitability while minimizing risk.

研究の動機と目的

信用審査や投資判断など金融MLアプリケーションにおける説明可能なAIの活用を促進する。
クレジットスコアリングのために、単純な分類器からアンサンブル法・ニューラルネットワークまでの幅広いMLモデルを評価する。
クレジットスコアリングモデルに対する事後説明性手法（LIME、SHAP）を評価する。
収益性を最大化しつつリスクを最小化することを目的としたMLベースの投資モデルとポートフォリオ戦略を開発する。
モデル評価におけるopen-access Lending Clubデータの適用性を明示する。

提案手法

クレジットスコアリングタスクにおいて、単一の分類器（ロジスティック回帰、決定木、LDA、QDA）、異種混成アンサンブル（AdaBoost、Random Forest）、および逐次ニューラルネットワークを比較する。
事後のモデル非依存型説明可能性技術（LIMEとSHAP）を適用してモデルの説明を評価する。
Lending Clubのオープンアクセスデータセットを活用してクレジットスコアリングモデルを評価する。
収益性とリスク最小化を目指したMLベースの投資モデルとポートフォリオ戦略を開発・検証する。
モデルの性能と説明可能性に関する定性的および定量的観察を報告する。

実験結果

リサーチクエスチョン

RQ1Lending Clubデータにおいてクレジットスコアリングの最良の性能を提供するMLモデルはどれか。
RQ2この設定でアンサンブル法とニューラルネットワークは単一の分類器とどう比較されるか。
RQ3LIMEとSHAPはクレジットスコアリングモデルの説明性にどれほど有効か。
RQ4基準戦略と比べて、MLベースの投資モデルは収益性を改善しつつリスクを低減できるか。

主な発見

アンサンブル分類器とニューラルネットワークはクレジットスコアリングにおいて単一分類器を上回る。
LIMEとSHAPはクレジットスコアリングモデルの説明可能性を評価するために適用される。
本研究は評価にLending Clubのオープンアクセスデータセットを使用する。
本研究はまたリスクを考慮して収益性を最適化するMLベースの投資モデルとポートフォリオ戦略を開発する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。