Image processing/Object Detection

[객체 탐지] Deep Learning for Generic Object Detection: A Survey

유니디니 2020. 3. 4. 18:12
728x90
반응형


초록 : 자연 영상에서 사전에 정의된 많은 수의 범주에서 객체 인스턴스를 찾는 것을 목표로 하는 객체 탐지는 컴퓨터 비전에서 가장 도전적 인 문제중 하나이다. 최근 객체 탐지 분야에서 딥러닝 방법은 데이터로부터 특징들을 학습하는 가장 영향력있는 방법으로써, Breakthrough (획기적인 발전)을 가져왔다. 

본 논문의 목적은 딥러닝 방법에 대한 Survey 논문으로 종합적인 설명을 제안하고 있다. 250가지 이상의 주요 기여가 포함되어 있으며, 객체 제안 생성, 객체 특징 표현, 상황 정보 모델링 및 학습전략, 벤치마크 데이터 셋, 평가 지표 및 최신 성능과 같은 여러 측면을 다룹니다. 


소개 : 객체 탐지는 오랜 기간동안 연구해왔으며 컴퓨터 비전 분야에서 도전적인 영역으로 여겨지고 있다. 객체 탐지의 목적은 주어진 영상에서 인스턴스 단위의 정의된 객체가 존재하는지, 존재한다면 경계 박스(Bounding Box)를 통해 공간적인 위치와 각 객체의 카테고리를 반환하는 것이다. 이러한 객체 탐지는 Robot Vision, Consumer Electronics, Security, Autonomous Driving, Human Computer Interaction, Content based Image Retrieval, Intelligent Video Surveillance, Augmented Reality등 다양한 분야에 활용됩니다. 


일반적인 객체탐지는 4개의 인식문제로 분류해 볼수 있다. 



(a) Image level object classification : 주어진 영상에서 위치 값에 관계없이, 하나 이상의 정의된 객체가 존재하는지 판단

(b) Generic Object Detection :  경계박스를 통한 관심영역 안의 객체 위치와 분류를 수행하는 것이 목적

(c) Semantic Segmentation : 같은 객체 안에서 인스턴스 단위 분류를 수행하지 않지만, 픽셀단위 객체 분류를 수행

(d) Object Instance Segmentation : 같은 객체 안에서 다른 인스턴스들에 대한 분류 수행, 픽셀단위 객체 분류 수행


Frameworks : 객체 탐지 방법에서 두가지 메인 흐름



Upper : Two-stage detection

Bottom : One-stage detection


1. Two-stage detection : 영역 제안(Region-proposal)의 전처리 과정을 포함하여, 전반적으로 두 단계의 과정을 거친다. 

2. One-stage detection : 영역 제안의 과정이 생략되었으며, 단일 단계의 과정을 거쳐 객체 탐지를 수행


*영역 제안 : 입력 영상에서 '물체가 있을 만한 영역'에 대해 찾는 방법, 기존 Sliding window 방식에 비해 연산량이 줄어들기 때문에, 훨씬 빠른 속도로 Object Detection을 수행할 수 있다. Ex) Selective Search, Edge Boxes


다음 포스팅에서 순서대로 나누어 올리도록 하겠습니다~

반응형