[论文解读] Unsupervised quantum machine learning for fraud detection
本文提出基于量子核的无监督异常检测(OC-SVM)用于信用卡欺诈检测,显示量子核在某些情况下可超过经典方法,在20个量子比特下的平均精度最高提升至约15%,并指出对近至中期硬件的潜在影响。
We develop quantum protocols for anomaly detection and apply them to the task of credit card fraud detection (FD). First, we establish classical benchmarks based on supervised and unsupervised machine learning methods, where average precision is chosen as a robust metric for detecting anomalous data. We focus on kernel-based approaches for ease of direct comparison, basing our unsupervised modelling on one-class support vector machines (OC-SVM). Next, we employ quantum kernels of different type for performing anomaly detection, and observe that quantum FD can challenge equivalent classical protocols at increasing number of features (equal to the number of qubits for data embedding). Performing simulations with registers up to 20 qubits, we find that quantum kernels with re-uploading demonstrate better average precision, with the advantage increasing with system size. Specifically, at 20 qubits we reach the quantum-classical separation of average precision being equal to 15%. We discuss the prospects of fraud detection with near- and mid-term quantum hardware, and describe possible future improvements.
研究动机与目标
- 将欺诈检测作为高度不平衡的信用卡数据集中的异常检测任务进行动机阐述。
- 以 AP 作为评估指标,对经典监督和无监督方法(逻辑回归、带 RBF 核的 SVC、以及带 RBF 核的 OC-SVM)在欺诈检测中的表现进行基准比较。
- 在 OC-SVM 框架内开发并测试基于量子核的异常检测。
- 比较不同的量子核实现(基于 IQP、重上传)与经典基线在越来越多的特征下的表现对比。
提出的方法
- 使用包含 28 个匿名特征的信用卡欺诈数据集,抽样得到 525 个样本,其中 25 个为欺诈样本。
- 通过缩放和主成分分析进行预处理,以改变特征数 N(等于量子嵌入中的量子比特数)。
- 基准比较经典方法:逻辑回归、带 RBF 核的 SVC、以及带 RBF 核的 OC-SVM,使用平均精度(AP)作为评估指标。
- 通过量子特征映射(具数据相关旋转和 ZZ 相互作用的类似 IQP 的量子线路)将数据嵌入量子态,并将量子核构建为态重叠或投影核。
- 评估带量子核的 OC-SVM(IQP 与重上传,d=3),并在增加的量子比特数下与经典 OC-SVM 的性能进行比较。
- 使用态矢量仿真(Pennylane/JAX)进行批量 Gram 矩阵评估,并分析平均精度趋势。)
实验结果
研究问题
- RQ1基于量子核的 OC-SVM 能否在无监督异常检测中改进欺诈检测,相较于经典核?
- RQ2随着特征空间(量子比特数)增加,量子核在 AP 上是否具备性能优势,以及在何种线路设计下(如带重上传的 IQP)?
- RQ3特征空间规模对使用量子核与经典核的有监督和无监督欺诈检测有何影响?
- RQ4在近中期量子硬件应用于量子欺诈检测(训练/推理时间、扩展性)方面有哪些实际考虑?
主要发现
- 在有监督任务中,量子核在某些特征范围(5–10 特征)内的平均精度超过 RBF 经典核超过 10 个百分点。
- 在无监督欺诈检测中,量子核显示出明显的分离,在 20 个量子比特时平均精度比经典核高出约 15%。
- 在测试的量子特征映射中,d=3 的重上传 IQP 电路提供最佳性能,特别是随着特征数量增加。
- 在 20 个量子比特下,量子-经典 AP 分离在无监督情境中约达到 15%。
- 经典 OC-SVM 使用 RBF 核在大于约 15 个特征后 AP 饱和约为 ~0.55,而量子核则继续提升。
- 总体而言,量子核在无监督欺诈检测中显示出更高的表达能力和学习相关多特征数据的潜在优势。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。