CV Paper List

Feature Pyramid Networks for Object Detection

Abstract

Feature pyramids는 다양한 scale의 objects를 감지하는 방법론이다.

본 논문은 CNN을 적용하여 multi-scale pytamid 구조인, Feature Pyramid Network (FPN)을 보여준다.

기존의 Faster R-CNN에 FPN을 적용하여 높은 성능을 보여주었다.

1. Introduction

Object를 다양한 scale에서 인식하는 것은 이미지에 존재하는 다양한 크기의 object를 이해하는데 필수적이다.

특히 작은 object를 인식하는데는 필수적이다.

3. Feature Pyramid Networks

FPN_Structure

Feature Pyramid Network[출처](https://herbwood.tistory.com/18)
  • Bottom-up pathway
    • 기존의 Conv model의 feed forward 과정에서 stage의 마지막 layer의 feature map을 추출한다.
      • 여기서 stage란, 이미지 크기가 유지되지만 깊은 layer를 쌓기 위해 추가되는 layer.
      • Stage의 마지막 layer에서 feature map을 추출하는 이유는, stage의 feature에 가장 강력한 정보가 담겨있다.
    • 본 논문의 네트워크는 총 5개의 stage로 구성되어 있는데, 첫 번째 stage의 feature map은 너무 많은 정보를 가지고 있어, 메모리 문제 때문에 피라미드에서 제외시켰다.
  • Top-down pathway
    • Bottom-up의 마지막 stage에서 얻은 feature들을 upsampling을 통해 크기를 2배 키워준다.