Skip to main content
QUICK REVIEW

[论文解读] Trivial Graph Features and Classical Learning are Enough to Detect Random Anomalies

Matthieu Latapy, Stephany Rajeh|arXiv (Cornell University)|Mar 2, 2026
Anomaly Detection Techniques and Applications被引用 0
一句话总结

本文表明仅使用经典机器学习的微不足道的图特征就能在各种链接流中检测随机注入的异常链接,且准确率高,通常优于更复杂的方法,同时实现高效且可解释。

ABSTRACT

Detecting anomalies in link streams that represent various kinds of interactions is an important research topic with crucial applications. Because of the lack of ground truth data, proposed methods are mostly evaluated through their ability to detect randomly injected links. In contrast with most proposed methods, that rely on complex approaches raising computational and/or interpretability issues, we show here that trivial graph features and classical learning techniques are sufficient to detect such anomalies extremely well. This basic approach has very low computational costs and it leads to easily interpretable results. It also has many other desirable properties that we study through an extensive set of experiments. We conclude that detection methods should now target more complex kinds of anomalies.

研究动机与目标

  • 在链接流中激发异常检测的研究动机并理解真值数据的局限性。
  • 提出一个轻量级框架(TGF),利用历史图中计算的平凡特征。
  • 在多样的真实世界数据集上对随机注入的异常进行评估。
  • 与复杂方法相比,展示该方法的可扩展性、灵活性和可解释性。

提出的方法

  • 定义 G 型和 H 型历史图,以捕获链接流中的多尺度时间上下文。
  • 使用递减排序计数器(DSC)结构,从历史图中计算大集合的平凡、可解释特征。
  • 在导出特征集上训练经典监督学习模型(主要是随机森林)以检测异常链接。
  • 在真实数据集中注入随机异常以提供带标签的评估数据。
  • 在多数据集及异常注入率上使用 ROC-AUC 进行评估,包括滑动窗口情景以评估实用性。

实验结果

研究问题

  • RQ1平凡的图特征结合经典学习是否能在多样化数据集上准确检测随机注入的异常链接?
  • RQ2不同历史图的持续时间和规模(多尺度历史)如何影响检测性能?
  • RQ3与最先进的异常检测方法相比,TGF 在准确性、效率和可解释性方面表现如何?
  • RQ4在实时或大规模场景中,带滑动窗口的TGF与各种学习算法的实用性如何?

主要发现

  • TGF在AUC上取得高分,在单一历史图时常超过0.95,使用历史组合时超过0.98。
  • TGF常常优于许多最先进的方法,同时保持简单、快速且易于解释。
  • 结合多种历史图(类型与规模)通常提升性能,并为不同数据集提供灵活性。
  • 滑动窗口实验显示在显著更少的最近数据下也能保持稳定性能,具有良好的实际可扩展性。
  • 不同学习器(随机森林、梯度提升、SVM)均表现稳健,在某些设置下SVM提供稳定性但计算成本较高。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。