Image processing/Object Detection

[객체 탐지] Selective Search for Object Recognition

유니디니 2020. 1. 28. 13:50
728x90
반응형

[참고 자료]


Paper : http://www.huppelen.nl/publications/selectiveSearchDraft.pdf


[1] https://donghwa-kim.github.io/SelectiveSearch.html




Selective Search for Object Recognition 방식은 R-CNN 계열의 논문에서 이미지 후보 영역을 추천할 때 사용하는 알고리즘이다. 


Segmentation과 Exhaustive search 두가지 방법을 결합하여 후보영역을 추천한다. 


Segmentation : 이미지 구조를 사용하여, 샘플링 프로세스를 안내


Exhaustive Search : 모든 객체의 위치(Locations)를 찾아내는 것


object detection 분야에서 R-CNN, SPPNet, Fast R-CNN 등에서 성능을 개선시키는 방법으로 활용되었으나 end-to-end의 방식으로 학습하기 어렵고 실시간 탐지과정에 있어 불가능하다. 이후, Faster R-CNN, YOLO등과 같이 후보영역을 추천하는 방법이 컨볼루션 내부의 망으로 들어오거나 변형된 형태로 발전하면서 실시간 탐지가 가능해지게 되었다. 


1. Selective Search의 특징


  • Capture All Scales : 이미지 내에서 물체의 크기는 랜덤하다. 또한 일부 객체는 다른 객체보다 경계가 덜 명확하다. 따라서, 모든 객체의 크기를 고려해야 한다. 


  • Diversification : 영역들을 그룹화하는데 있어 최적화된 단일 전략은 없다. 따라서 색상, 재질(텍스쳐), 크기 등 다양한 종류의 조건을 고려하여 다룰 필요가 있다. 

(a) 다양한 크기의 물체, (b) 재질은 유사하지만 색상이 다른 고양이,
(c) 색상이 동일하지만, 재질이 다른 카멜레온, (d) 색상과 재질이 유사하지 않지만 차량의 일부인 바퀴


  • Fast to Compute : 이 방법의 목표는 실제 객체 탐지 프레임워크에서 사용할 수 있어야 하며, 계산상 병목현상(bottleneck)이 발생하면 안되므로 빨라야 한다. 

2. Selective Search 알고리즘의 계층적 그룹화



R : 선택된 초기 영역들

S : 영역들간의 유사도 집합


각각의 영역들에 대한 유사도 초기화

While(반복

1. 가장 유사도가 높은 영역 i,와 j 선택

2. 선택된 영역을 t로 병합

3. i와 j가 연관된 다른 유사도 집합들은 제거

4. 병합된 t영역과 나머지 영역들간의 유사도 재정의

5. 새로운 유사도 집합에 합쳐진 영역을 추가 포함

6. 하나의 영역이 될때 까지 반복


3. 유사도 측정방법


[0,1] 사이로 정규화된 4가지 요소(색상, 재질, 크기, 채움-Fill)들의 가중합으로 계산한다. 


 


반응형