QUICK REVIEW

[論文レビュー] Accelerating Convolutional Neural Networks for Continuous Mobile Vision via Cache Reuse.

Mengwei Xu, Xuanzhe Liu|arXiv (Cornell University)|Dec 1, 2017

Advanced Neural Network Applications参考文献 37被引用数 5

ひとこと要約

本稿では、連続的なモバイルビジョンを高速化するために、連続するフレーム間の類似画像領域からの畳み込み特徴を再利用する、透過的なキャッシング機構であるCNNCacheを提案する。効率的な画像照合アルゴリズムとキャッシュ対応の推論エンジンを組み合わせることで、コンsumer Androidデバイス上でも最大47.1%の高速化を達成し、3.51%未満の精度損失に抑えることができる。

ABSTRACT

Convolutional Neural Network (CNN) is the state-of-the-art algorithm of many mobile vision fields. It is also applied in many vision tasks such as face detection and augmented reality on mobile devices. Though benefited from the high accuracy achieved via deep CNN models, nowadays commercial mobile devices are often short in processing capacity and battery to continuously carry out such CNN-driven vision applications. In this paper, we propose a transparent caching mechanism, named CNNCache, that can substantially accelerate CNN-driven mobile continuous vision tasks without any efforts from app developers. To cache and reuse the computations of the similar image regions which are consecutively captured by mobile devices, CNNCache leverages two novel techniques: an image matching algorithm that quickly identifies similar image regions between images, and a cache-aware CNN inference engine that propagates the reusable regions through varied layers and reuses the computation results at layer granularity. We implement a prototype of CNNCache to run on commodity Android devices, and evaluate it via typical CNN models. The results show that CNNCache can accelerate the execution of CNN models by 20.2% on average and up to 47.1% under certain scenarios, with no more than 3.51% accuracy loss.

研究の動機と目的

連続的なビジョンタスクに深く畳み込みニューラルネットワーク（CNN）を実行する際のパフォーマンス制限およびバッテリ消費の課題に対処すること。
既存のモバイルアプリケーションを変更することなく、CNN推論を透過的に高速化することを可能にすること。
連続する動画フレーム間の空間的および時間的類似性を活用し、CNNにおける重複計算を削減すること。
中間特徴マップの再利用を最大化するために、レイヤー単位で動作するキャッシング機構を設計すること。
実際のモバイルデプロイメント環境において、高いモデル精度を維持したまま顕著な高速化を達成すること。

提案手法

空間的および特徴類似性に基づいて、連続するフレーム間の類似画像領域を迅速に特定するための画像照合アルゴリズムを開発すること。
個々のレイヤーの粒度で再利用可能な特徴マップをネットワークの各レイヤーにわたって伝搬できる、キャッシュ対応のCNN推論エンジンを設計すること。
アプリケーションコードを変更せずに既存のCNN推論パイプラインに統合できる、透過的なキャッシングレイヤーを実装すること。
類似領域における重複する畳み込みをスキップすることで、推論時の計算負荷を削減するため、特徴マップの再利用を活用すること。
多様なモバイルビジョンワークロードにわたるヒット率を最大化するとともに、メモリオーバーヘッドを最小限に抑えるキャッシュ管理を最適化すること。
実世界での評価を目的として、コンsumer Androidデバイス上でプロトタイプを実装し、システムを統合すること。

実験結果

リサーチクエスチョン

RQ1フレーム間の類似画像領域からの特徴再利用によって、連続的なモバイルビジョンにおける重複計算を効果的に削減できるか？
RQ2軽量な画像照合アルゴリズムは、モバイルデバイス上でリアルタイムに類似領域を効率的に特定できるか？
RQ3レイヤー単位での特徴再利用によって、モデル精度を劣化させることなく、CNN推論をどの程度高速化できるか？
RQ4実世界のモバイルビジョンアプリケーションにおいて、提案されたキャッシング機構のパフォーマンス向上と精度損失のトレードオフはどの程度か？
RQ5既存のモバイルアプリケーションやモデルを変更することなく、このキャッシング機構を透過的にデプロイできるか？

主な発見

CNNCacheは、コンsumer Androidデバイス上での一般的なCNNモデルにおいて、平均して20.2%の高速化を達成した。
最適な状況では、非常に類似した画像領域からの特徴再利用により、最大47.1%の加速が実現された。
特徴再利用によって引き起こされる精度損失は、評価されたモデルおよびワークロード全体で3.51%未満に抑えられた。
画像照合アルゴリズムは、低コストの計算オーバーヘッドで高速な類似性検出を可能にし、リアルタイムのモバイル利用に適している。
キャッシュ対応の推論エンジンは、複数のレイヤーにわたって再利用可能な特徴を効果的に伝搬し、再計算を最小限に抑えた。
この機構はアプリケーション開発者に対して完全に透過的であり、既存のCNNモデルやアプリケーションの変更を一切必要としない。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。