반응형

Image processing/Real-time 6

ERFNet : Efficient Residual Fatorized ConvNet for Real-time Semantic Segmentation

Written by Romera, Jose M. Alvarez, Luis M. Bergasa and Roberto Arroyo [Abstract] 지능형 차량의 인식 요구사항을 통합된 방식으로 해결하는 것은 어려운 Task에 속한다. Deep Neural Network는 픽셀 수준에서 이미지의 여러 개체 범주를 분류하기 위해 End-to-End 학습을 수행하기 때문에 적합하다. 그러나, 고품질 성능, 제한된 리소스 간의 trade-off를 지키는 좋은 접근 방식이 존재하지 않기 때문에 실제 차량에서의 적용이 제한된다. 본 논문에서는 정확도 높은 실시간 딥 아키텍쳐를 제안한다. 우리는 뛰어난 정확도를 유지하기 위해 Residual connection과 factorized convolutions를 사용한 새..

[2015] Flattened Convolutional Neural Networks for Feedforward Acceleration

Written by Jonghoon Jin, Aysegul Dundar & Eugenio Culurciello [Introduction] 빠른 Feed Forward 실행을 위해 설계된 평면화 된 컨볼루션 신경망을 제시하고자 한다. Parameter들의 중복성, 특히 컨볼루션 신경망에서 컨볼루션 필터의 가중치에 대해 광범위하게 연구되었으며 학습 후 필터의 Low rank 기반을 구성하기 위해 다양한 방법들이 제안되었다. 본 논문에서는 3D 공간에서 모든 방향에 걸쳐 연속적인 1차원 필터로 구성된 평면화된 네트워크를 학습시켜 기존 컨볼루션과 비슷한 성능을 얻었다. 기존 필터의 중복된(redundancy) 계산을 줄였고, 학습과정에서 3D 필터들을 1D 필터들의 연속된 3번 계산으로 달성할 수 있었다. (l..

[2016] ENet : A Deep Neural Network Architecture for Real-Time Semantic Segmentation

[Abstract] pixel-wise Segmentation in real time에서 큰 숫자의 floating point operation은 단점으로 여겨지며, 긴~ run-times로 인해 작동능력을 방해한다. 본 논문에서는 낮은 latency 연산으로 구성된 새로운 딥 뉴럴 네트워크 구조를 제안하였다. E-Net은 기존 대비 18배 이상 빠르며 75배 보다 적은 FLOPS, 79배 적은 파라미터 값을 가지고, 기존 모델에 비해 더 나은 정확도를 보이고 있다. CamVid, Cityscapes, Sun 데이터 셋에서 좋은 성능을 보였으며, 정확도와 네트워크 처리 속도 사이의 Trade-off가 존재한다. 우리는 임베디드 시스템에서 제안된 아키텍처의 성능측정을 제시하고, ENet을 더 빠르게 만들 ..

[2018] ICNet for Real-Time Semantic Segmentation on High-Resolution Images

Written by Hengsuang Zhao, Xiaojuan Qi, Xiaoyong Shen, Jianping Shi, Jiaya Jia Abstract Real-time Segmentation 분야에서는 픽셀단위 라벨 추론에 대한 계산량을 줄이는데 있어, 어려움을 가지고 있다. 계층 단위 Multi-Resolution 브랜치들을 이용하여 적절한 label guidance 방법을 수행하였으며, 이미지 해상도에 따른 다양한 정보들을 Cascaded Fusion 하였다. 제안하는 방법은Cityscapes, CamVid, COCO-Stuff 등에서 빠른 속도와 high quality segmentation 결과를 보이고 있다. Introduction CNN-based Semantic Segmentation..

[2018] Pelee: Real-Time Object Detection System On Mobile Devices

Written by Robert J. Wang, Xiang Li & Charles X. Ling Git : https://github.com/Robert-JunWang/Pelee [Abstract] 컨볼루션 신경망이 제한된 Computing Power나 메모리 Resource를 가진 모바일 디바이스에서 동작하기 위해서는 효율적인 모델 디자인이 필요하다. 이에 MobileNet, SuffleNet, MobileNetV2과 같은 형태의 방법들이 제안되었으며, 대부분의 모델들은 효율적인 구현이 부족한 Depthwise separable convolution에 크게 의존하고 있었다. 우리는 기존의 컨볼루션 대신, 효율적인 구조의 PeleeNet를 제안하였다. 우리는 ImageNet ILSVRC 2012 데이터 ..

[2018] BiseNet : Bilateral Segmentation Network for Real-time Semantic Segmenatation

Written by Changqian Yu, Jingbo Wang, Chao Peng, Changxin Gao, Gang Yu and Nong Sang Semantic segmentation 분야에서는 Spatial 정보와 상당한 Receptive field를 요구한다. 그러나, 현대의 방법들은 공간적인 해상도(performance)와 real-time inference speed 간의 trade-off를 고려하게 된다. 이러한 문제를 해결하고자, Spatial 정보들을 유지하면서 고 해상도 특징들을 추출하고 fast down-sampling 전략을 통해 속도가 빠르며 충분한 receptive field를 유지하는 방법을 소개하고자 한다. 또한, Spatial과 Context path를 통해 나온 정보들..

반응형