참고 자료
Paper : https://arxiv.org/pdf/1708.02002.pdf
One Stage Object Detector의 경우 속도는 빠르지만, R-CNN 계열의 Two Stage Object Detector 보다 성능이 낮다. R-CNN 계열은 RPN과정을 통해 전경과 배경을 어느정도 분류하지만, One stage의 경우 특징맵의 그리드를 활용하기에 배경영역이 상대적으로 많이 포함되어 있다. 이러한 오류는 데이터의 클래스 불균형(Class - imbalance) 문제를 일으키며 본 논문에서는 기존의 손실함수(Cross-Entropy)를 변형시켜 해결하고자 한다. 분류하기 어려운 예제들 (Hard Positives examples-Object)에 높은 가중치를 부여하는 반면 쉬운 예제(Easy Negatives examples-Background)에는 작은 가중치를 할당하여 어려운 예제에 더욱 집중하여 학습한다.
- 탐지기는 한장의 이미지에서 수많은 후보 위치를 제안하지만 실제로 분류하고자 하는 객체가 포함된 경우는 매우 드물다. 이러한 클래스 불균형 문제는 학습과정에서 문제를 일으킨다.
- 배경과 같은 분류하기 쉬운 Easy negative들이 대부분을 차지하기 때문에 학습에 악영향을 끼친다.
- 따라서, Scaling factor를 활용하여 학습 데이터에 대한 가중치를 조절하자.
이진 분류를 위한 교차 엔트로피 손실
Focal Loss
파라미터인 는 0~5사이의 값으로 실험하였으며, 논문에서는 2의 값이 가장 좋은 결과를 냈다고 한다.
실험에 있어 경우의 수는 두가지가 있으며, 첫번째는 Example을 분류 성능이 낮고 ~0.5로 작은 값을 가질때
두번째 example은 잘 분류하고, ~ 1인 경우이다. 첫번째 예시의 경우 Loss 함수에 영향을 주지 않고, 두번째 예시의 경우 파라미터를 통해 영향력을 줄여준다.
2. RetinaNet
기본 Resnet에 FPN 방법을 결합하였으며, One-stage detector를 활용하였다. Subnet에서는 Class와 bounding box Regression을 동시에 수행한다. 본 논문에서는 새로운 손실함수를 적용하는 것이 핵심 아이디어이므로, 간단한 네트워크에 적용해보았다.
3. 실험 결과
Two stage 방법과 비교해봤을때, 좋은 결과를 보였다.
다양한 파라미터를 바꿔서 실험했으며, 정확도/속도에 대한 trade-off 실험 또한 진행하였다.
'Image processing > Object Detection' 카테고리의 다른 글
[객체 탐지] Two-stage Detection (0) | 2020.03.09 |
---|---|
[객체 탐지] Deep Learning for Generic Object Detection: A Survey (0) | 2020.03.04 |
[객체 탐지] Selective Search for Object Recognition (0) | 2020.01.28 |
[객체 탐지] Feature Pyramid Networks for Object Detection (0) | 2020.01.20 |
[객체 탐지] DSSD : Deconvolutional Single Shot Detector (0) | 2020.01.13 |