Skip to main content
QUICK REVIEW

[论文解读] Improving Credit Card Fraud Detection with an Optimized Explainable Boosting Machine

Fazel Reza, Arash Bakhtiary|arXiv (Cornell University)|Feb 6, 2026
Imbalanced Data Classification Techniques被引用 0
一句话总结

本研究对 Explainable Boosting Machine (EBM) 进行优化,用 Taguchi 基础的预处理和超参数调优来进行信用卡欺诈检测,在不进行重采样的情况下,对不均衡数据集的 ROC-AUC 最高可达 0.983。

ABSTRACT

Addressing class imbalance is a central challenge in credit card fraud detection, as it directly impacts predictive reliability in real-world financial systems. To overcome this, the study proposes an enhanced workflow based on the Explainable Boosting Machine (EBM)-a transparent, state-of-the-art implementation of the GA2M algorithm-optimized through systematic hyperparameter tuning, feature selection, and preprocessing refinement. Rather than relying on conventional sampling techniques that may introduce bias or cause information loss, the optimized EBM achieves an effective balance between accuracy and interpretability, enabling precise detection of fraudulent transactions while providing actionable insights into feature importance and interaction effects. Furthermore, the Taguchi method is employed to optimize both the sequence of data scalers and model hyperparameters, ensuring robust, reproducible, and systematically validated performance improvements. Experimental evaluation on benchmark credit card data yields an ROC-AUC of 0.983, surpassing prior EBM baselines (0.975) and outperforming Logistic Regression, Random Forest, XGBoost, and Decision Tree models. These results highlight the potential of interpretable machine learning and data-driven optimization for advancing trustworthy fraud analytics in financial systems.

研究动机与目标

  • 在信用卡欺诈检测中解决类别不平衡挑战,同时保持模型可解释性。
  • 为 EBM 开发一个无需重采样的优化预处理与超参数调优管道。
  • 证明 EBM 在欺诈检测性能上能够匹配或优于非可解释模型。
  • 评估特征重要性及交互作用,为从业者提供可操作的洞察。

提出的方法

  • 使用 Explainable Boosting Machine (EBM),一种基于 GA²M 的玻璃盒模型,对单变量和成对交互进行可解释建模。
  • 应用五种数据转换器(归一化、标准化、幂变换、分位数变换、鲁棒缩放)并通过 Taguchi 方法优化其顺序。
  • 使用 Taguchi 正交表对多种模型(逻辑回归、随机森林、决策树、XGBoost、EBM)进行超参数优化。
  • 基于 EBM 的全局解释选择 top 特征并重新训练模型以比较性能。
  • 将 EBM 与逻辑回归、随机森林、XGBoost、决策树在 ROC-AUC 和其他指标上进行比较。

实验结果

研究问题

  • RQ1一个经过优化的 EBM 在仔细选择的预处理步骤下,是否能够在不重采样的前提下,在不均衡的信用卡数据上实现具有竞争力的欺诈检测性能?
  • RQ2基于 EBM 解释的特征选择对预测准确性和模型简化性有何影响?
  • RQ3基于 Taguchi 的放缩器和超参数优化与网格搜索在效率与性能上有何差异?
  • RQ4在所用数据集中,哪些特征及其交互对欺诈检测最具影响力?

主要发现

ScalerModelBest ParametersPrecisionRecallROC_AUCF1 Score
minmaxLRfeature_range: (-1 , 1)0.8450.5450.7730.663
standardLRwith_mean: False; with_std: False0.7920.6910.8450.738
quantileLRn_quantiles: 1000; output_distribution: ’uniform’0.7940.7360.8680.764
robustLRquantile_range: (25.0 , 75.0)0.8250.6000.8000.695
powerLRmethod’: ’yeo-johnson’0.8230.5910.7950.688
minmaxRFfeature_range: (0 , 0.5)0.9760.7270.8640.833
standardRFwith_mean: False; with_std: False0.9750.7180.8590.827
quantileRFn_quantiles: 1000; output_distribution: ’normal’0.9750.7180.8590.827
robustRFquantile_range: (25.0 , 75.0)0.9750.7180.8590.827
powerRFmethod: ’yeo-johnson’0.9520.7180.8590.819
minmaxDTfeature_range: (-1 , 1)0.6700.6820.8410.676
standardDTwith_mean: True; with_std: True0.6390.6910.8450.664
quantileDTn_quantiles: 1000; output_distribution: ’normal’0.6720.7090.8540.690
robustDTquantile_range: (25.0 , 75.0)0.6700.6820.8410.676
powerDTmethod: ’yeo-johnson’0.6670.6730.8360.670
minmaxXGBfeature_range: (0 , 1)0.9760.7360.8680.839
standardXGBwith_mean: True ; with_std: True0.9760.7360.8680.839
quantileXGBn_quantiles: 1500 ; output_distribution: ’normal’0.9760.7360.8680.839
robustXGBquantile_range: (25.0 , 75.0)0.9760.7360.8680.839
powerXGBmethod: ’yeo-johnson’0.9760.7360.8680.839
minmaxEBMfeature_range’: (0 , 1)0.9880.7550.8770.856
standardEBMwith_mean: True ; with_std: True0.9880.7550.8770.856
quantileEBMn_quantiles: 1000 ; output_distribution: ’normal’0.9760.7550.8770.851
robustEBMquantile_range: (25.0 , 75.0)0.9880.7550.8770.856
powerEBMmethod: ’yeo-johnson’0.9880.7550.8770.856
  • 使用前 18 个特征时,EBM 达到 ROC-AUC 0.983,超越先前的 EBM 基线和其他模型。
  • 在使用优化的预处理和超参数后,EBM 在评估指标上优于逻辑回归、随机森林、XGBoost 和决策树。
  • Taguchi 优化在相对于 GridSearchCV 等穷举方法时降低了计算成本,同时获得更优秀或具有竞争力的 ROC-AUC。
  • 大多数特征多重共线性较低到中等;但 Amount 显示出较高的方差膨胀因子(VIF),被识别为对预测性能特别具有因果性的因素。
  • DoWhy 因果分析表明 Amount 与多特征存在强因果关系,移除 Amount 会降低模型精度。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。