QUICK REVIEW

[論文レビュー] BlazeIt: Optimizing Declarative Aggregation and Limit Queries for Neural Network-Based Video Analytics

Daniel Kang, Peter Bailis|arXiv (Cornell University)|May 2, 2018

Advanced Image and Video Retrieval Techniques参考文献 60被引用数 28

ひとこと要約

BlazeIt は、制御変数としての専用ニューラルネットワークと優先順位付き探索アルゴリズムを用いて、集約および LIMIT クエリの最適化を図る、ニューラルネットワークベースの動画分析のための宣言的クエリシステムを導入する。不完全なプロキシモデルが存在しても正確な保証を維持しつつ、従来手法比最大 83 倍の高速化を達成する。

ABSTRACT

Recent advances in neural networks (NNs) have enabled automatic querying of large volumes of video data with high accuracy. While these deep NNs can produce accurate annotations of an object's position and type in video, they are computationally expensive and require complex, imperative deployment code to answer queries. Prior work uses approximate filtering to reduce the cost of video analytics, but does not handle two important classes of queries, aggregation and limit queries; moreover, these approaches still require complex code to deploy. To address the computational and usability challenges of querying video at scale, we introduce BlazeIt, a system that optimizes queries of spatiotemporal information of objects in video. BlazeIt accepts queries via FrameQL, a declarative extension of SQL for video analytics that enables video-specific query optimization. We introduce two new query optimization techniques in BlazeIt that are not supported by prior work. First, we develop methods of using NNs as control variates to quickly answer approximate aggregation queries with error bounds. Second, we present a novel search algorithm for cardinality-limited video queries. Through these these optimizations, BlazeIt can deliver up to 83x speedups over the recent literature on video processing.

研究の動機と目的

大規模な動画分析に向けたディープニューラルネットワーク（DNN）の導入に伴う高い計算コストと、複雑な命令的コードの必要性に対処すること。
集約および LIMIT クエリという、従来の近似フィルタリング技術では十分にサポートされていないクラスの効率的で宣言的な動画データクエリを可能にすること。
全フレームレベルの DNN 推論を必要とせずに、正確な答えまたは形式的な誤差バウンドを提供すること。
専用ニューラルネットワークを制御変数として用い、クエリに特化した最適化により、高価な DNN の呼び出し回数を削減すること。
宣言的クエリ記述とエンドツーエンドの最適化を統合し、専門知識のないユーザーが FrameQL を用いて複雑な動画分析ワークロードを記述できるようにすること。

提案手法

動画分析のための宣言的 SQL 拡張である FrameQL を導入し、時空間的オブジェクト情報を仮想関係として表現する。
クエリ固有の専用ニューラルネットワークを制御変数として用い、近似集約クエリの分散を低減することで、誤差バウンドを保証しつつ DNN の呼び出し回数を削減する。
プロキシモデルを用いて、ターゲットイベント（例：3台以上の車両が存在するフレーム）を含む可能性の高いフレームを優先する、新しい探索アルゴリズムを適用し、LIMIT クエリの効率を向上させる。
DNN 呼び出し回数を最小限に抑えつつ正確性の保証を維持する、ルールベースのクエリ最適化エンジンを採用する。
二値検出を超えて、多クラスおよびカウントワークロードへの特化を拡張することで、集約および LIMIT クエリの両方をサポートする。
専用 NN の不正確さに対しても耐性を持つ最適化を統合し、プロキシモデルの品質にかかわらず正しさまたは誤差バウンドを保証する。

実験結果

リサーチクエスチョン

RQ1専用ニューラルネットワークを制御変数として再利用することで、動画分析における近似集約クエリの高速化が有効に可能か？
RQ2プロキシモデルによるフレーム優先順位付けにより、正確性を損なわず、カーディナリティ制限付きクエリ（例：3台の車両を含むフレームを 10 件まで）の効率がどのように向上するか？
RQ3宣言的クエリ言語および最適化エンジンを用いて、複雑な動画分析ワークロードのための自動的な効率的実行計画を生成できるか？
RQ4クエリ固有の最適化により、DNN 推論コストをどの程度削減できるか、かつ形式的な誤差バウンドを維持できるか？
RQ5頻度の高いおよびまれなオブジェクトパターンの両方において、NoScope や近似クエリ処理といった従来のシステムと比較して、これらの最適化はどの程度の性能向上を達成するか？

主な発見

BlazeIt は、特に集約および LIMIT クエリにおいて、最先端技術比最大 83 倍の高速化を達成する。
専用ニューラルネットワークを制御変数として用いることで、集約推定の分散が低減され、大幅に少ない DNN 呼び出し回数で正確な結果が得られる。
LIMIT クエリ向けの優先順位付き探索アルゴリズムにより、高確率の候補に焦点を当てることで、完全な DNN 推論が必要なフレーム数が削減され、とくにレアイベントに対して顕著な効果を示す。
BlazeIt は、専用ニューラルネットワークが不正確であっても、制御変数および探索ベースの設計により、形式的な正確性保証を維持する。
特にフィルタリングが非効率となる高頻度オブジェクトのシナリオにおいて、NoScope や近似クエリ処理といった従来のフィルタリングベースのアプローチを上回る性能を発揮する。
FrameQL を用いることで、専門知識のないユーザーが、エンドツーエンドの最適化がシステムによって自動的に処理される形で、複雑な動画分析クエリを宣言的に記述できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。