[论文解读] Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts
OCLADS 是一个框架,通过边缘协助的在线持续学习,在物联网的设备端实现异常检测;利用智能样本选择和分布偏移检测仅在有利时更新模型。
In this work, we present OCLADS, a novel communication framework with continual learning (CL) for Internet of Things (IoT) anomaly detection (AD) when operating in non-stationary environments. As the statistical properties of the observed data change with time, the on-device inference model becomes obsolete, which necessitates strategic model updating. OCLADS keeps track of data distribution shifts to timely update the on-device IoT AD model. To do so, OCLADS introduces two mechanisms during the interaction between the resource-constrained IoT device and an edge server (ES): i) an intelligent sample selection mechanism at the device for data transmission, and ii) a distribution-shift detection mechanism at the ES for model updating. Experimental results with TinyML demonstrate that our proposed framework achieves high inference accuracy while realizing a significantly smaller number of model updates compared to the baseline schemes.
研究动机与目标
- 在设备端模型对非平稳数据分布变得过时时,激励物联网中的异常检测。
- 开发一个协作框架,仅在数据分布发生漂移时在边缘更新 TinyML 模型。
- 通过智能样本选择和 CL 在保持高推断精度的同时尽量降低通信开销。
- 证明所提方法在非平稳条件下减少模型更新同时保持性能。
提出的方法
- 在物联网设备处引入基于异常分数阈值的智能样本选择机制,以优先发送信息量大的样本(包括困难负样本)。
- 在边缘服务器上采用基于回放的持续学习方法,使用接收并存储的样本进行模型训练和更新。
- 在边缘使用假设检验框架(基于 OCSVM 的分数和基于 L2 范数的检验统计量及置换检验)来检测连续批次之间的分布漂移。
- 仅在检测到分布漂移时触发边缘到设备的模型更新,减少不必要的通信。
- 在启用选择性传输前,先进行一个初始标定阶段,对一部分轮次进行全部数据传输。
- 在 CIFAR-10 和 SVHN 上通过模拟协变量漂移(损坏)进行评估,并在整个过程中测量在线宏观 F1-score。
实验结果
研究问题
- RQ1IoT 设备如何选择性传输信息数据以支持边缘的有效在线持续学习?
- RQ2边缘的分布漂移检测机制是否能高效触发模型更新,以在非平稳条件下保持高异常检测性能?
- RQ3在这个在线持续学习设置中,通信成本(模型更新)与设备端推断精度之间的权衡是多少?
- RQ4在分布漂移条件下,OCLADS 与基线更新策略在更新频率和检测性能方面有何比较?
主要发现
- OCLADS 将设备端模型更新次数降低到 All-update 方案的 10% 以下,同时保持较高的推断性能(在 CIFAR-10 和 SVHN 上);
- 在 CIFAR-10 和 SVHN 中,漂移在 755 个批次中的分别发生于 54 个(CIFAR-10)和 73 个(SVHN),其中检测到 39(CIFAR-10)和 51(SVHN)。
- 该框架在在线宏观 F1-score 上与 All-update 相当,但更新次数显著减少;在检测到漂移后进行的更新优于随机调度。
- 类 Oracle 的漂移检测可使 OCLADS 在仅约 7% 的批次上更新的情况下接近 All-update 的性能。
- 无更新策略表现最差,而随机更新表明在漂移后及时更新比任意时机更有利。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。