QUICK REVIEW

[논문 리뷰] SSAP: Single-Shot Instance Segmentation With Affinity Pyramid

Naiyu Gao, Yanhu Shan|arXiv (Cornell University)|2019. 09. 04.

Advanced Image and Video Retrieval Techniques참고 문헌 50인용 수 30

한 줄 요약

이 논문은 하나의 순방향 전파에서 의미 클래스 레이블링과 인스턴스 인식 특징 학습을 동시에 학습하는 단일 스풍, 프로포절 없는 인스턴스 세분화 방법인 SSAP을 제안한다. 계층적인 픽셀 쌍 유사도 피라미드를 사용하여, 이는 도시 환경에서 36.9%의 PQ로 기존 방법보다 5배 빠른 속도와 9% 상대적인 AP 향상을 달성하며, 새로운 최고 성능을 기록한다.

ABSTRACT

Recently, proposal-free instance segmentation has received increasing attention due to its concise and efficient pipeline. Generally, proposal-free methods generate instance-agnostic semantic segmentation labels and instance-aware features to group pixels into different object instances. However, previous methods mostly employ separate modules for these two sub-tasks and require multiple passes for inference. We argue that treating these two sub-tasks separately is suboptimal. In fact, employing multiple separate modules significantly reduces the potential for application. The mutual benefits between the two complementary sub-tasks are also unexplored. To this end, this work proposes a single-shot proposal-free instance segmentation method that requires only one single pass for prediction. Our method is based on a pixel-pair affinity pyramid, which computes the probability that two pixels belong to the same instance in a hierarchical manner. The affinity pyramid can also be jointly learned with the semantic class labeling and achieve mutual benefits. Moreover, incorporating with the learned affinity pyramid, a novel cascaded graph partition module is presented to sequentially generate instances from coarse to fine. Unlike previous time-consuming graph partition methods, this module achieves $5 imes$ speedup and 9% relative improvement on Average-Precision (AP). Our approach achieves state-of-the-art results on the challenging Cityscapes dataset.

연구 동기 및 목표

의미 레이블링과 인스턴스 그룹화를 별도의 모듈로 처리하는 기존의 프로포절 없는 인스턴스 세분화 방법의 비효율성과 열등한 성능을 해결하기 위해.
두 작업 간 상호 이점을 활용하기 위해 의미 클래스 예측과 인스턴스 인식 유사도 계산을 공동으로 학습할 수 있도록 하기 위해.
저해상도에서 고해상도 특징 맵으로의 계층적 유사도를 활용하여, 계단식 그래프 분할 모듈을 설계함으로써 추론 속도를 가속화하기 위해.
영역 프로포절에 의존하지 않고 도전적인 벤치마크인 Cityscapes에서 최고 성능을 달성하기 위해.

제안 방법

짧은 거리와 긴 거리 유사도를 모두 활용하여 두 픽셀이 같은 인스턴스에 속할 확률을 계산하는 픽셀 쌍 유사도 피라미드를 제안한다.
짧은 거리 유사도에는 조밀한 작은 수신장과, 긴 거리 유사도에는 희소하고 저해상도의 특징 맵을 사용하며, 다중 해상도 U-Net 특징 간에 분리된 방식으로 처리한다.
의미 세분화 예측과 유사도 피라미드를 통합하여 하나의 단일 백본 네트워크에서 공동 최적화를 수행한다.
유사도에서 생성된 그래프를 기반으로 하부에서 상부로 점진적으로 정밀도를 높이는 계단식 그래프 분할 모듈을 도입한다.
낮은 층의 고해상도 예측을 활용하여 고해상도 그래프 분할에서 노드 수를 줄여 5배의 속도 향상을 달성한다.
하나의 저해상도 결과에서의 신뢰도를 활용하여 고해상도 분할을 지도하고 가속화하는 계층적, 하향식 그래프 분할 전략을 채택한다.

실험 결과

연구 질문

RQ1의미 세분화와 인스턴스 인식 유사도 계산의 공동 학습이 프로포절 없는 인스턴스 세분화의 성능 향상에 기여할 수 있는가?
RQ2계층적 유사도 피라미드가 인스턴스 그룹화를 위해 픽셀 간 국소적 관계와 장거리 관계를 효과적으로 모델링할 수 있는가?
RQ3다양한 해상도 수준 간의 계단식 그래프 분할이 정확도를 유지하거나 향상시키면서 추론 시간을 크게 줄일 수 있는가?
RQ4단일 스푸, 엔드 투 엔드 학습 가능한 프레임워크가 벤치마크 데이터셋에서 다단계 프로포절 기반 또는 다단계 프로포절 없는 방법보다 뛰어난 성능을 낼 수 있는가?

주요 결과

제안된 방법은 Cityscapes 검증 세트에서 36.9%의 PQ를 달성하여, 프로포절 없는 방법 중에서 새로운 최고 성능을 기록하였다.
의미 레이블링과 유사도 예측의 공동 학습은 상호 보완적 성능 향상을 이끌었으며, 비공동 기반 베이스라인 대비 9% 상대적인 AP 향상을 달성하였다.
계단식 그래프 분할 모듈은 비계단식 대비 5배의 추론 속도 향상을 달성하면서도 AP를 9% 상대적으로 향상시켰다.
COCO 테스트-dev 세트에서 자동차 인스턴스에 대해 32.7%의 AP와 55.9%의 PQ를 기록하여, DeeperLab와 같은 이전의 프로포절 없는 방법을 초월하였다.
시각적 결과는 사람이나 기둥에 일부가 가려진 차량과 같이 부분적으로 가려진 또는 분리된 객체를 정확하게 그룹화하는 데 성공하였다.
이 방법은 도시 환경을 초월하여 COCO에서도 우수한 성능을 보이며, 프로포절 생성 없이도 잘 일반화됨을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.