[論文レビュー] Automatic Anomaly Detection in the Cloud Via Statistical Learning
本稿は、季節性を除去し頑健な統計量を用いることで、クラウド指標の異常を自動的に識別するための2つの季節性異常検知法、S-ESDとS-H-ESD、を提案します。
Performance and high availability have become increasingly important drivers, amongst other drivers, for user retention in the context of web services such as social networks, and web search. Exogenic and/or endogenic factors often give rise to anomalies, making it very challenging to maintain high availability, while also delivering high performance. Given that service-oriented architectures (SOA) typically have a large number of services, with each service having a large set of metrics, automatic detection of anomalies is non-trivial. Although there exists a large body of prior research in anomaly detection, existing techniques are not applicable in the context of social network data, owing to the inherent seasonal and trend components in the time series data. To this end, we developed two novel statistical techniques for automatically detecting anomalies in cloud infrastructure data. Specifically, the techniques employ statistical learning to detect anomalies in both application, and system metrics. Seasonal decomposition is employed to filter the trend and seasonal components of the time series, followed by the use of robust statistical metrics -- median and median absolute deviation (MAD) -- to accurately detect anomalies, even in the presence of seasonal spikes. We demonstrate the efficacy of the proposed techniques from three different perspectives, viz., capacity planning, user behavior, and supervised learning. In particular, we used production data for evaluation, and we report Precision, Recall, and F-measure in each case.
研究の動機と目的
- 季節性および多峰性の時系列を伴うクラウド/サービス指向アーキテクチャにおいて自動異常検知の必要性を動機づける。
- 季節性/トレンド成分を分離し、異常検知に頑健な統計量を適用する手法を開発する。
- 容量計画、ユーザー行動、および監視付き学習シナリオの生産データで提案手法を評価する。
- 高い異常割合への頑健性を評価し、実運用展開に対する指針を提供する。
提案手法
- 季節性・トレンド・残差成分を得るために時系列分解を適用する(LOESSを用いた修正版STL)。
- 残差成分に対してESDを用いて異常を検出する(S-ESD)。
- 平均/標準偏差を頑健な統計量である中央値とMADに置換することで異常検知の普及度を高める季節性ハイブリッドESD(S-H-ESD)を導入する。
- 系列中央値を安定したトレンド表現として用いることで偽りの残差異常を抑制するためにSTLを拡張する。
- 段階的導入アプローチを提供し、異常率の変化に対してS-ESDとS-H-ESDを比較する。
実験結果
リサーチクエスチョン
- RQ1クラウド時系列の季節性および多峰性を異常検知のためにどのように効果的に扱えるか。
- RQ2データの大半が異常である場合、頑健な統計量(中央値とMAD)は異常検知を改善するか。
- RQ3容量計画、ユーザー行動、監視付き異常注入における本番環境でのS-ESDとS-H-ESDの比較性能はどうか。
- RQ4リアルタイムのクラウド監視環境にこれらの手法をデプロイする際の実務的考慮事項は何か。
主な発見
- S-ESDは季節成分を除去した後、グローバルな異常と局所的な異常の両方を検出できる。
- 中央値とMADを用いるS-H-ESDはデータの高い割合が異常である場合により頑健である。
- システム指標とコアドライバの生産データで手法を評価し、観点ごとにPrecision、Recall、F-measureを報告した。
- 本番環境の導入では、監視指標の異常検知にalpha=0.05を用いたS-H-ESDを選択した。
- 異常検知は容量計画の支援、ユーザー行動の変化分析、指示された異常を注入した監視学習実験の支援を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。