YOLO : You Only Look Once: Unified, Real-Time Object Detection 논문 요약
Abstract 객체 탐지의 이전 연구들에서는 분류기에서도 detection을 수행할 수 있도록 했다. 본 연구에서는 하나의 단일 신경망을 사용해서 여러 bounding box와 class probabilities를 예측하는 객체 탐지를 regression 문제로 취급했다. 본 연...
Abstract 객체 탐지의 이전 연구들에서는 분류기에서도 detection을 수행할 수 있도록 했다. 본 연구에서는 하나의 단일 신경망을 사용해서 여러 bounding box와 class probabilities를 예측하는 객체 탐지를 regression 문제로 취급했다. 본 연...
Abstract 지난 몇년동안(2013) PASCAL VOC dataset에 관해 객체 탐지의 성능 향상이 더디다. 대화마다 best model은 일반적으로 여러개의 저수준 피처와 고수준의 context를 결합한 복잡한 앙상블 구조이다. 본 연구에서는 단순한 탐지 알고리즘으로 V...
Atrous Convolution이란? DeepLabv3+ 논문을 리뷰하기 앞서 DeepLab 모델들에서 사용된 핵심 기법인 Atrous Convolution에 대해 알아보자.
Abstract 좋은 딥러닝 네트워크를 구축하기 위해서는 수많은 데이터가 필요하다. 본 논문에서는 데이터 증강에 의존하여 주어진 데이터를 효율적으로 사용한 네트워크와 학습 방법에 대해 소개한다. 네트워크는 특징을 추출하는 contracting(수축) path와 localizati...
Abstract 신경망의 깊이가 깊어질수록 학습은 더 어려워진다. 본 논문에서는 레이어를 잔차함수로 변환하는 residual learning framework를 적용하여 이전의 모델들보다 더 깊은 신경망일지라도 학습이 잘 되게 했다. 깊이가 최대 152로 VGG모델보다 8배 깊은 ...