QUICK REVIEW

[論文レビュー] Fully Convolutional Neural Network for Fast Anomaly Detection in Crowded Scenes.

Mohammad Sabokrou, Mohsen Fayyaz|arXiv (Cornell University)|Sep 3, 2016

Anomaly Detection Techniques and Applications被引用数 34

ひとこと要約

本論文は、時間的モデリングと段階的外部層検出を活用して、教師なし異常認識を達成する、完全畳み込みニューラルネットワーク（FCN）に基づく高速な異常検出および局所化手法を提案する。この手法は、SubwayおよびUCSDベンチマークで最先端の精度を達成しながら、370 fpsの推論速度を実現する。

ABSTRACT

We present an efficient method for detecting and localizing anomalies in videos showing crowded scenes. Research on {\it fully convolutional neural networks} (FCNs) has shown the potentials of this technology for object detection and localization, especially in images. We investigate how to involve temporal data, and how to transform a supervised FCN into an unsupervised one such that the resulting FCN ensures anomaly detection. Altogether, we propose an FCN-based architecture for anomaly detection and localization in crowded scenes videos. For reducing computations and, consequently, improving performance both with respect to speed and accuracy, we investigate the use of cascaded out-layer detection. Our architecture includes two main components, one for feature representation, and one for cascaded out-layer detection. Experimental results on Subway and UCSD benchmarks confirm that the detection and localization accuracy of our method is comparable to state-of-the-art methods, but at a significantly increased speed of 370 fps.

研究の動機と目的

混雑した動画シーンにおける効率的でリアルタイムな異常検出システムの開発を目的とする。
時間的動画データを統合することで、教師ありFCNを教師なし異常検出に適応することを目的とする。
計算コストを低減し、推論速度を向上させつつ、検出精度を損なわないこと。
複雑で混雑した環境における異常の正確な局所化を可能とすること。

提案手法

本手法は、空間的・時間的特徴表現を担うコンponentと、段階的外部層検出を担うコンponentからなる二段階FCNアーキテクチャを採用する。
時間的モデリングがFCNに統合され、動画フレーム間での動きのパターンを捉える。
ネットワークは、動画クリップから正常なシーンのパターンを学習することで、教師なしの方法で訓練される。
段階的外部層検出は、高活性化領域に焦点を当てることで、計算負荷を低減する。
外部層コンponentにおける期待される特徴マップからの逸脱を特定することで、異常の局所化が達成される。
完全結合層を最小限に抑え、空間的畳み込みを最大化することで、速度最適化がなされている。

実験結果

リサーチクエスチョン

RQ1FCNは、混雑した動画シーンにおける教師なし異常検出に効果的に適応可能か？
RQ2時間的情報を、異常検出のための完全畳み込みフレームワークに効率的に統合できるか？
RQ3段階的外部層検出は、推論時間を著しく短縮しつつ、検出精度を維持できるか？
RQ4リアルタイムな混雑シーンにおける異常検出において、速度と精度のトレードオフは何か？

主な発見

提案手法は、370 fpsというリアルタイムの推論速度を達成しており、従来手法に比べて顕著に高速である。
SubwayおよびUCSDベンチマークにおける検出および局所化精度は、最先端の手法と同等である。
段階的外部層検出の活用により、性能を劣化させることなく計算複雑性が著しく低減された。
教師なし学習戦略により、正常なシーンのパターンが効果的に学習され、効果的な異常検出が可能となった。
FCN内での時間的モデリングにより、混雑したシーンにおける異常な動きのパターンを検出する能力が向上した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。