QUICK REVIEW

[논문 리뷰] RetinaMask: A Face Mask detector

Mingjie Jiang, Xinqi Fan|arXiv (Cornell University)|2020. 05. 08.

Face recognition and analysis참고 문헌 35인용 수 156

한 줄 요약

이 논문은 특징 피라미드 네트워크와 새로운 컨텍스트 어텐션 모듈을 사용하여 검출 정확도를 향상시키는 일단계(one-stage) 얼굴 마스크 검출기인 RetinaFaceMask를 제안한다. 공개 데이터셋에서 최신 기술 수준(SOTA) 성능을 달성하며, 정밀도는 각각 2.3%와 1.5% 높고, 재현율은 각각 11.0%와 5.9% 높으며, MobileNet을 활용한 경량 배포도 가능하다.

ABSTRACT

Coronavirus disease 2019 has affected the world seriously. One major protection method for people is to wear masks in public areas. Furthermore, many public service providers require customers to use the service only if they wear masks correctly. However, there are only a few research studies about face mask detection based on image analysis. In this paper, we propose RetinaFaceMask, which is a high-accuracy and efficient face mask detector. The proposed RetinaFaceMask is a one-stage detector, which consists of a feature pyramid network to fuse high-level semantic information with multiple feature maps, and a novel context attention module to focus on detecting face masks. In addition, we also propose a novel cross-class object removal algorithm to reject predictions with low confidences and the high intersection of union. Experiment results show that RetinaFaceMask achieves state-of-the-art results on a public face mask dataset with $2.3\%$ and $1.5\%$ higher than the baseline result in the face and mask detection precision, respectively, and $11.0\%$ and $5.9\%$ higher than baseline for recall. Besides, we also explore the possibility of implementing RetinaFaceMask with a light-weighted neural network MobileNet for embedded or mobile devices.

연구 동기 및 목표

공중보건 및 안전 분야에서의 자동 얼굴 마스크 검출 증가 수요를 해결하기 위해.
실세계 환경에서 얼굴 마스크 인식의 정확도와 효율성을 향상시키기 위해.
고성능을 유지하면서도 모바일 또는 임베디드 장치에 배포 가능한 모델을 개발하기 위해.
기존 얼굴 마스크 검출 시스템의 한계를 극복하기 위해 맥락 인식 특징 학습과 신뢰도 기반 예측 필터링을 도입하기 위해.

제안 방법

다중 척도 특징 맵 융합을 통해 국소화 성능을 향상시키기 위해 특징 피라미드 네트워크를 통합한 RetinaNet 기반의 단일 단계 객체 검출 프레임워크를 사용한다.
마스크 검출에 관련된 영역에 집중함으로써 특징 표현을 향상시키는 새로운 컨텍스트 어텐션 모듈을 도입한다.
IoU 임계값을 활용하여 저신뢰도 예측을 제거하고 거짓 양성 결과를 줄이기 위해 교차 클래스 객체 제거 알고리즘을 적용한다.
모바일 및 임베디드 플랫폼에서의 효율적 추론을 가능하게 하기 위해 백본 네트워크로 MobileNet을 사용하는 경량 변형을 설계한다.
데이터 증강을 통해 강인성을 확보하기 위해 공개된 얼굴 마스크 검출 데이터셋에서 모델을 엔드 투 엔드로 훈련시킨다.
클래스 불균형 문제를 해결하기 위해 포칼 손실(focal loss)을 사용하여 손실 함수를 최적화한다.

실험 결과

연구 질문

RQ1특징 피라미드 융합과 어텐션 메커니즘을 갖춘 단일 단계 검출기로 기존 방법에 비해 우수한 얼굴 및 마스크 검출 성능를 달성할 수 있는가?
RQ2제안된 컨텍스트 어텐션 모듈이 마스크 영역 검출 정확도 향상에 얼마나 효과적인가?
RQ3교차 클래스 객체 제거 알고리즘이 거짓 양성 결과를 얼마나 줄이고 검출 신뢰도를 향상시키는가?
RQ4경량 모바일 또는 임베디드 하드웨어에서 높은 정확도를 유지하면서도 효율적으로 배포할 수 있는가?

주요 결과

기준 모델 대비 RetinaFaceMask는 얼굴 검출에서 2.3% 높은 정밀도, 마스크 검출에서 1.5% 높은 정밀도를 기록한다.
얼굴 검출에서 11.0% 높은 재현율, 마스크 검출에서 5.9% 높은 재현율을 기록하여, 특히 마스크를 쓴 얼굴의 검출 성능 향상을 시사한다.
제안된 컨텍스트 어텐션 모듈은 복잡하거나 가림이 있는 상황에서도 특징 표현을 크게 향상시킨다.
교차 클래스 객체 제거 알고리즘은 저신뢰도 예측을 효과적으로 줄여 전체 검출 신뢰도를 향상시킨다.
경량 MobileNet 기반 변형은 정확도 손실이 크지 않게 모바일 및 임베디드 장치에 효율적으로 배포할 수 있다.
종합적으로 RetinaFaceMask는 공개 얼굴 마스크 검출 벤치마크에서 새로운 최신 기술 수준 성능을 확립했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.