Skip to main content
QUICK REVIEW

[論文レビュー] One-Class Support Measure Machines for Group Anomaly Detection

Krikamol Muandet, Bernhard Schölkopf|arXiv (Cornell University)|Mar 1, 2013
Anomaly Detection Techniques and Applications参考文献 24被引用数 43
ひとこと要約

本稿では、再帰的カーネルヒルバート空間(RKHS)におけるカーネル平均埋め込みを用いて、データグループを確率分布としてモデル化することで、グループ異常を検出する非パrametricフレームワーク、One-Class Support Measure Machines(OCSMMs)を提案する。この手法は、1クラスSVMを分布へ一般化し、定量的推定の問題として定式化することで、特に通常の点の集合が異常な集団的行動を示す場合の検出を可能にし、SDSS や高エネルギー物理学データなど実世界のデータセットにおいて競争力ある性能を達成している。

ABSTRACT

We propose one-class support measure machines (OCSMMs) for group anomaly detection which aims at recognizing anomalous aggregate behaviors of data points. The OCSMMs generalize well-known one-class support vector machines (OCSVMs) to a space of probability measures. By formulating the problem as quantile estimation on distributions, we can establish an interesting connection to the OCSVMs and variable kernel density estimators (VKDEs) over the input space on which the distributions are defined, bridging the gap between large-margin methods and kernel density estimators. In particular, we show that various types of VKDEs can be considered as solutions to a class of regularization problems studied in this paper. Experiments on Sloan Digital Sky Survey dataset and High Energy Particle Physics dataset demonstrate the benefits of the proposed framework in real-world applications.

研究の動機と目的

  • 個々の点が正常であるがその集団的行動が異常であるような状況において、データポイントのグループにおける異常な集団的行動を検出する課題に対処すること。
  • 潜在的な分布のパラメトリックな形を仮定しない非パrametric手法を開発することで、従来の生成モデルよりも広範な適用可能性を実現すること。
  • 事前に点レベルの異常検出に依存せず、直接的にグループレベルの異常を同定するトップダウンの検出アプローチを提供することで、計算効率を向上させること。
  • 1クラスSVMのような大マージン法と、VKDEのようなカーネル密度推定法との間のギャップを、分布レベルの異常検出の文脈で埋めること。

提案手法

  • 各データポイントのグループを、独立同分布(i.i.d.)標本からの経験的推定により確率分布として表現する。
  • カーネル平均埋め込みを用いて、各分布を再帰的カーネルヒルバート空間(RKHS)にマップし、分布をベクトルとして操作可能にする。
  • 確率測度の空間における分位数推定問題としてグループ異常検出を定式化し、経験的分布の裾部に位置する分布を同定する。
  • RKHS埋め込み上のマージンベース最適化を定義することで、1クラスSVMを測度の空間へ一般化し、OCSMMsを導出する。
  • OCSMMsと変動カーネル密度推定器(VKDEs)との間の理論的関係を確立し、VKDEsがOCSMMsに内在する正則化問題の一種の解として得られることを示す。
  • RKHS埋め込みにガウスカーネルを用い、双対定式化により最適化問題を解くことで、計算を効率化する。

実験結果

リサーチクエスチョン

  • RQ1パラメトリックでない分布レベルのアプローチは、点ベースや生成モデルに比べて、グループ異常をより効果的に検出できるか?
  • RQ21クラスSVMは、個々のデータポイントではなく確率測度上で動作するようにどのように一般化できるか?
  • RQ3分布レベルの異常検出の文脈において、大マージン法とカーネル密度推定器との関係は何か?
  • RQ4提案手法は、ヒッグスボソン信号検出のような文脈で、通常の点のグループに見られる微細で高次の統計的異常を検出できるか?
  • RQ5事前に点レベルの異常検出に依存するボトムアップ手法と比較して、トップダウンのOCSMMスレッドは性能と効率においてどう異なるか?

主な発見

  • OCSMMsは、個々の点が異常でない場合でも、グループレベルの異常を検出する点で、従来の点異常検出アルゴリズムを上回っている。
  • スローンデジタルスカイサーベイ(SDSS)データセットにおいて、OCSMMsは異常な集団的行動を示す銀河のグループを効果的に検出している。
  • 高エネルギー物理学実験において、OCSMMsはヒッグスボソン信号をバックグラウンドイベントの中の異常なグループとして、競争力あるROC性能で検出している。
  • OCSMMフレームワークはMGMアルゴリズムを上回り、KNNベースのグループ異常検出と同等またはそれを上回るAUC性能を達成している。
  • 直接的なトップダウン検出戦略のおかげで、計算が効率的かつスケーラブルであり、オンラインおよび大規模応用に適している。
  • 理論的分析により、さまざまな変動カーネル密度推定器(VKDEs)が、OCSMMsの背後にある同一の正則化問題の解として導かれることが示され、大マージン法と密度推定アプローチとの間の正式な関係が確立された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。