Image processing/Object Detection

[객체 탐지] Focal Loss for Dense Object Detection

유니디니 2020. 1. 29. 13:14
728x90
반응형



참고 자료


Paper : https://arxiv.org/pdf/1708.02002.pdf


[1] https://towardsdatascience.com/neural-networks-intuitions-3-focal-loss-for-dense-object-detection-paper-explanation-61bc0205114e




One Stage Object Detector의 경우 속도는 빠르지만, R-CNN 계열의 Two Stage Object Detector 보다 성능이 낮다. R-CNN 계열은 RPN과정을 통해 전경과 배경을 어느정도 분류하지만, One stage의 경우 특징맵의 그리드를 활용하기에 배경영역이 상대적으로 많이 포함되어 있다. 이러한 오류는 데이터의 클래스 불균형(Class - imbalance) 문제를 일으키며 본 논문에서는 기존의 손실함수(Cross-Entropy)를 변형시켜 해결하고자 한다. 분류하기 어려운 예제들 (Hard Positives examples-Object)에 높은 가중치를 부여하는 반면 쉬운 예제(Easy Negatives examples-Background)에는 작은 가중치를 할당하여 어려운 예제에 더욱 집중하여 학습한다. 




  • 탐지기는 한장의 이미지에서 수많은 후보 위치를 제안하지만 실제로 분류하고자 하는 객체가 포함된 경우는 매우 드물다. 이러한 클래스 불균형 문제는 학습과정에서 문제를 일으킨다.
  • 배경과 같은 분류하기 쉬운 Easy negative들이 대부분을 차지하기 때문에 학습에 악영향을 끼친다.
  • 따라서, Scaling factor를 활용하여 학습 데이터에 대한 가중치를 조절하자.

1. Focal Loss


이진 분류를 위한 교차 엔트로피 손실




Focal Loss 





파라미터인 는 0~5사이의 값으로 실험하였으며, 논문에서는 2의 값이 가장 좋은 결과를 냈다고 한다.

실험에 있어 경우의 수는 두가지가 있으며, 첫번째는 Example을 분류 성능이 낮고 ~0.5로 작은 값을 가질때

두번째 example은 잘 분류하고, ~ 1인 경우이다. 첫번째 예시의 경우 Loss 함수에 영향을 주지 않고, 두번째 예시의 경우 파라미터를 통해 영향력을 줄여준다. 


2. RetinaNet



기본 Resnet에 FPN 방법을 결합하였으며, One-stage detector를 활용하였다. Subnet에서는 Class와 bounding box Regression을 동시에 수행한다. 본 논문에서는 새로운 손실함수를 적용하는 것이 핵심 아이디어이므로, 간단한 네트워크에 적용해보았다.  



3. 실험 결과



Two stage 방법과 비교해봤을때, 좋은 결과를 보였다. 




다양한 파라미터를 바꿔서 실험했으며, 정확도/속도에 대한 trade-off 실험 또한 진행하였다.  

반응형