QUICK REVIEW

[논문 리뷰] Deep CMST Framework for the Autonomous Recognition of Heavily Occluded and Cluttered Baggage Items from Multivendor Security Radiographs.

Taimur Hassan, Salman H. Khan|arXiv (Cornell University)|2019. 12. 09.

Advanced Neural Network Applications인용 수 14

한 줄 요약

이 논문은 다중벤더 X선 스캔에서 심하게 가림되거나 혼잡한 수화물 항목을 자율적으로 감지하고 인식하기 위해 계곡형 구조 텐서 접근 방식을 사용하는 새로운 딥 CMST 프레임워크를 제안한다. 순차적으로 다양한 방향에서 윤곽 기반 전이 특징을 추출하고 단일 피드포워드 CNN을 활용함으로써, GDXray에서 mAP 0.9343, SIXray에서 mAP 0.9595의 최신 기술 수준 성능을 달성하였으며, 추론 속도는 15.78% 향상되었다.

ABSTRACT

In the last two decades, luggage scanning has globally become one of the prime aviation security concerns. Manual screening of the baggage items is a cumbersome, subjective and inefficient process. Hence, many researchers have developed Xray imagery-based autonomous systems to address these shortcomings. However, to the best of our knowledge, there is no framework, up to now, that can recognize heavily occluded and cluttered baggage items from multi-vendor X-ray scans. This paper presents a cascaded structure tensor framework which can automatically extract and recognize suspicious items irrespective of their position and orientation in the multi-vendor X-ray scans. The proposed framework is unique, as it intelligently extracts each object by iteratively picking contour based transitional information from different orientations and uses only a single feedforward convolutional neural network for the recognition. The proposed framework has been rigorously tested on publicly available GDXray and SIXray datasets containing a total of 1,067,381 X-ray scans where it significantly outperformed the state-of-the-art solutions by achieving the mean average precision score of 0.9343 and 0.9595 for extracting and recognizing suspicious items from GDXray and SIXray scans, respectively. Furthermore, the proposed framework has achieved 15.78% better time

연구 동기 및 목표

항공 보안 분야에서 크고 가려진, 혼잡한 수화물 항목을 수동으로 점검하는 데 발생하는 핵심 과제를 해결하기 위해.
X선 스캔에서 방향이나 위치에 관계없이 위험한 물품을 인식할 수 있는 강력하고 벤더에 종속되지 않는 시스템을 개발하기 위해.
복잡한 방사선 환경에서 완전히 자율적이고 실시간으로 감지를 가능하게 하여 수동 점검에 대한 의존도를 줄이기 위해.
기준 데이터셋에서 기존 최신 기술 수준의 방법들보다 정확도와 추론 속도 면에서 뛰어난 성능을 내기 위해.

제안 방법

프레임워크는 X선 스캔에서 다중 방향 윤곽 기반 전이 특징을 추출하기 위해 계곡형 구조 텐서 기반 메커니즘을 활용한다.
다양한 방향에서 이미지 구조를 반복적으로 분석하여 가려진 및 혼잡한 물체의 특징 표현을 향상시킨다.
종단 간 인식을 위해 단일 피드포워드 컨volution 신경망을 사용하여 모델 복잡도와 추론 시간을 최소화한다.
공간 기울기 정보를 활용하여 노이즈가 많고 혼잡한 장면에서 물체 경계와 구조 전이를 식별한다.
일관된 일반화를 확보하기 위해 다양한 다중벤더 X선 데이터셋에서 프레임워크를 훈련 및 평가한다.
실시간 구현을 최적화하여 이전 방법들에 비해 뚜렷한 속도 향상을 달성한다.

실험 결과

연구 질문

RQ1다중 X선 스캐너 벤더 간에 심하게 가려지고 혼잡한 수화물 항목을 효과적으로 감지하고 인식할 수 있는 단일 통합 프레임워크가 가능한가?
RQ2기존 방법과 비교해 복잡하고 겹치는 수화물 장면에서 계곡형 구조 텐서 접근 방식은 특징 추출을 어떻게 향상시키는가?
RQ3단일 피드포워드 CNN을 사용할 경우 계산 오버헤드를 줄이면서도 높은 정확도를 유지할 수 있는가?
RQ4공개 기준 데이터셋에서 기존 최신 기술 수준의 솔루션과 비교해 성능 및 속도 면에서 프레임워크는 어떻게 성과를 내는가?
RQ5재학습 없이 다양한 영상 조건과 스캐너 유형 간에 프레임워크가 일반화 가능한가?

주요 결과

딥 CMST 프레임워크는 GDXray 데이터셋에서 mAP 0.9343을 달성하여 이전 최신 기술 수준의 방법들을 뛰어넘었다.
SIXray 데이터셋에서는 mAP 0.9595를 기록하여 복잡하고 혼잡한 장면에서도 뛰어난 인식 정확도를 입증했다.
기존 솔루션 대비 추론 시간을 15.78% 단축시켜 더 빠른 실시간 점검을 가능하게 했다.
계곡형 구조 텐서 접근 방식은 다양한 방향에서 가려진 및 겹치는 물체로부터 특징 추출을 효과적으로 향상시켰다.
단일 피드포워드 CNN의 사용은 낮은 모델 복잡도와 더불어 더 빠른 추론을 가능하게 하며 높은 정확도를 유지했다.
다양한 다중벤더 X선 스캔에서의 강력한 일반화 능력을 입증하여 실제 항공 보안 환경에서의 강건성과 실용적 구현 가능성을 확인했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.