QUICK REVIEW
[论文解读] Adaptive KDE for Real-Time Thresholding: Prioritized Queues for Financial Crime Investigation
Danny Butvinik, Nana Boateng|arXiv (Cornell University)|Jan 20, 2026
Network Traffic and Congestion Control被引用 0
一句话总结
本文提出一种以密度锚定的在线自适应 KDE 框架,将流式风险分数通过对密度谷的捕捉转换为稳定、具容量感知的阈值,从而在非平稳分布下实现多队列路由。
ABSTRACT
We study the problem of converting a continuous stream of risk scores into stable decision thresholds under non-stationary score distributions. This problem arises in a wide range of detection systems where scores must be partitioned into prioritized processing regions while preserving semantic consistency over time.
研究动机与目标
- 形式化在流式、非平稳分布下单队列和多队列路由的密度锚定阈值化。
- 开发适用于流式分数数据的在线自适应 KDE,含边界修正。
- 识别持久的密度谷作为自然且可解释的阈值锚,以确保稳定的进入。
- 将容量约束纳入以引导阈值放置,同时保持分数单调性。
- 在容量遵循、积压行为和运行时方面评估运营性能。
提出的方法
- 将分数 s 置于 [0,1],在固定网格上使用边界反射的 Epanechnikov KDE 估计 f。
- 使用带滑动窗口或指数衰退的在线更新规则,通过 Abramson’s rule 更新 f 和带宽 h。
- 将估计密度的局部最小值识别为阈值放置的谷地候选。
- 将密度转换为尾部质量曲线以推导容量对齐的截断,并在不同带宽下将阈值捕捉到最近的持久谷地。
- 通过滞后效应、最小支撑 guards 以及可选的区间内微调来实现稳定性,以达到精确容量。
- 通过选择满足单独容量目标且在队列内保持分数单调性的谷地对,扩展到多阈值设置。

实验结果
研究问题
- RQ1如何在没有标签的情况下,将流式分数分布转化为稳定、具容量感知的阈值?
- RQ2密度谷地能否作为鲁棒且可解释的锚点,用于单队列和多队列在漂移下的阈值化?
- RQ3在线 KDE 参数(窗口大小、遗忘因子、带宽更新)对容量遵循和阈值稳定性有何影响?
- RQ4与传统分位数或前 K 方法相比,谷地捕捉对积压和队列动态有何影响?
- RQ5该框架是否可扩展到具有每项活动分布的多-BA 设置,同时保持单调性?
主要发现
- 通过对谷地进行捕捉实现容量一致的阈值,从而降低由于分布漂移带来的进入敏感性。
- 带边界修正的在线自适应 KDE 实现了稳定、无需标签的阈值化,适用于实时路由。
- 跨带宽的谷地持久性提供了鲁棒的阈值锚,限制阈值抖动。
- 该方法在保持队列内分数单调性的同时,支持单阈值和多阈值设置。
- 在合成漂移流上的实验显示出具有竞争力的容量跟踪、可控的积压和运行时表现。
- 每事件更新的时间复杂度为 O(G),每个业务活动的内存为 O(G)。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。