[論文レビュー] WearMask: Fast In-browser Face Mask Detection with Serverless Edge Computing for COVID-19
WearMask は、NCNN と WebAssembly を介して YOLO-Fastest を実行するサーバーレスなエッジコンピューティングフレームワークを用い、インストール不要で任意のウェブブラウザ内でマスク検出を行います。
The COVID-19 epidemic has been a significant healthcare challenge in the United States. According to the Centers for Disease Control and Prevention (CDC), COVID-19 infection is transmitted predominately by respiratory droplets generated when people breathe, talk, cough, or sneeze. Wearing a mask is the primary, effective, and convenient method of blocking 80% of all respiratory infections. Therefore, many face mask detection and monitoring systems have been developed to provide effective supervision for hospitals, airports, publication transportation, sports venues, and retail locations. However, the current commercial face mask detection systems are typically bundled with specific software or hardware, impeding public accessibility. In this paper, we propose an in-browser serverless edge-computing based face mask detection solution, called Web-based efficient AI recognition of masks (WearMask), which can be deployed on any common devices (e.g., cell phones, tablets, computers) that have internet connections using web browsers, without installing any software. The serverless edge-computing design minimizes the extra hardware costs (e.g., specific devices or cloud computing servers). The contribution of the proposed method is to provide a holistic edge-computing framework of integrating (1) deep learning models (YOLO), (2) high-performance neural network inference computing framework (NCNN), and (3) a stack-based virtual machine (WebAssembly). For end-users, our web-based solution has advantages of (1) serverless edge-computing design with minimal device limitation and privacy risk, (2) installation free deployment, (3) low computing requirements, and (4) high detection speed. Our WearMask application has been launched with public access at facemask-detection.com.
研究の動機と目的
- インストールの障壁とハードウェアコストを削減することで、COVID-19 期間中の公衆衛生を支援するアクセス可能なマスク検出を促進する。
- デバイス非依存でインストール不要な展開を提供し、データをローカルで処理してユーザのプライバシーを保護する。
- GPUを持たないエッジデバイスに適した、軽量で高速な推論パイプラインを開発する。
- ブラウザベースのデプロイメントのために、ディープラーニング(YOLO)、高性能推論フレームワーク(NCNN)、WebAssembly の統合を実証する。
提案手法
- 混在する実マスクデータセット(MAFA、WIDER FACE)および追加のインターネットサンプル上で、軽量な YOLO-Fastest 検出器(EfficientNet-lite エンコーダ)を訓練する。
- PyTorch モデルを NCNN 形式に変換し、C++ 推論パイプラインを実装する。
- 推論パイプラインを WebAssembly にコンパイルして、WASM モジュール内の NCNN 経由でブラウザ内で実行できるようにする。
- ビデオデータをユーザーのデバイス上でローカルに処理するサーバーレスエッジコンピューティング設計を実装する。
- インストール不要なデプロイを示すため、facemask-detection.com で公衆に公開可能なブラウザ内デモを起動する。
- 代表的なエッジデバイス上での検出性能(mAP@0.5)と推論速度をベンチマークする。
実験結果
リサーチクエスチョン
- RQ1ブラウザ内でのサーバーレスエッジコンピューティングは、インストールやクラウド資源を必要とせず、正確で高速なマスク検出をサポートできるか?
- RQ2WearMask をブラウザで実行した場合の検出精度(mAP@0.5)と、典型的なエッジデバイスで達成できる FPS はどの程度か?
- RQ3WearMask パイプラインは、YOLO-Fastest、NCNN、WebAssembly をどのように統合してデバイス非依存のデプロイを実現するか?
- RQ4クラウドではなくローカルでビデオを処理することのプライバシーとデプロイの利点は何か?
主な発見
- YOLO-Fastest モデルは、120 回の訓練エポック後に IoU=0.5 での平均適合率 (mAP@0.5) を 0.89 に達成した。
- WearMask フレームワークは NCNN と WebAssembly によって動作するブラウザ内アプリケーションとして展開され、インストール不要でデバイス非依存のエッジ推論を実現する。
- システムは、エンドユーザーのデバイス上でビデオデータをローカルに処理することで低いハードウェア要件とプライバシーを強調しており、公開デモサイト facemask-detection.com を備える。
- このアプローチは、公共施設や小規模ビジネスでのリアルタイムシナリオに適した高速検出を目指し、クラウドベースのソリューションに対するコスト効率の高い代替手段を提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。