[论文解读] Generalizing Logic-based Explanations for Machine Learning Classifiers via Optimization
本文提出两种基于优化的方法(Onestep 和 Twostep)来膨胀基于逻辑的可推断解释,以提升覆盖率并控制计算时间。
Machine learning models support decision-making, yet the reasons behind their predictions are opaque. Clear and reliable explanations help users make informed decisions and avoid blindly trusting model outputs. However, many existing explanation methods fail to guarantee correctness. Logic-based approaches ensure correctness but often offer overly constrained explanations, limiting coverage. Recent work addresses this by incrementally expanding explanations while maintaining correctness. This process is performed separately for each feature, adjusting both its upper and lower bounds. However, this approach faces a trade-off: smaller increments incur high computational costs, whereas larger ones may lead to explanations covering fewer instances. To overcome this, we propose two novel methods. Onestep builds upon this prior work, generating explanations in a single step for each feature and each bound, eliminating the overhead of an iterative process. extit{Twostep} takes a gradual approach, improving coverage. Experimental results show that Twostep significantly increases explanation coverage (by up to 72.60\% on average across datasets) compared to Onestep and, consequently, to prior work.
研究动机与目标
- 提高对 ML 分类器的基于逻辑的可生成功能性解释的泛化能力。
- 开发在扩展解释范围时保证正确性的方法。
- 在生成膨胀解释时实现覆盖率与计算效率的平衡。
- 将方法应用于支持向量机(SVM)和多层感知机(MLP)分类器,并在多个数据集上进行评估。
提出的方法
- 将分类器(SVM 和 MLP)表示为一阶逻辑公式并转化为 MILP/LP 形式,以获得正确的可推断解释。
- 引入 Onestep:在每个界限的一步中通过优化找出最大/最小的特征范围,避免迭代增量的方式。
- 引入 Twostep:通过控制扩展顺序来提升全局解释覆盖率并降低对任一单一特征的过度约束。
- 通过 MILP/LP 求解来验证可满足性,从而对线性 SVC 实现多项式时间的验证。
- 定义 P 以捕捉必要的预测条件,并推导 E,使 E ∪ D ⊨ P 且 E 为最小。

实验结果
研究问题
- RQ1在 ML 分类器中,如何在保持正确性的前提下膨胀基于逻辑的解释?
- RQ2与增量方法相比,基于优化的膨胀方法是否能提升可推断解释的覆盖率?
- RQ3在使用 Onestep 和 Twostep 时,覆盖提升与计算时间之间的权衡是什么?
- RQ4提出的方法是否也能有效应用于超出测试数据集的 SVM 和 MLP 模型?
- RQ5在合成数据集与真实数据集上,解释的一般化表现如何?
主要发现
- Twostep 相较 Onestep 在跨数据集的解释覆盖率平均提升最高可达 72.60%。
- Twostep 的计算时间比 Onestep 增加约 55.65%。
- Onestep 在每个界限/每个特征只需一个优化步骤即可计算膨胀解释,避免迭代范围过度扩展。
- 解释通过求解表示分类器及其领域约束的 MILP/LP 形式来获得。
- 实验评估四项指标:计算时间、原始数据集的覆盖率、合成数据的覆盖率、以及在 12 个数据集上的范围宽度。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。