
EfficientFormer: Vision Transformers at MobileNet Speed 논문 리뷰
·
AI paper review/Mobile-friendly
2022년 Snap Inc. 에서 게재한 논문인 EfficentFormer 논문을 리뷰합니다. 1. Introduction 해당 논문은 주요 내용은 다음과 같습니다. "Vision Transformer(ViT)가 high performance를 내면서 (mobile device에서) mobilenet만큼 빨라질 수 있을까"에 대한 의문점에서 시작 기본적으로 VIT는 accuracy 성능은 좋은데 lightweight CNN(e.g. MobileNet)보다 느리다는 단점을 가짐 그 의문점을 풀기 위해 기존 ViT의 inefficient한 구조에 대해 분석 Efficient한 구조를 갖는 dimension-consistent한 ViT 모델(EfficientFormer) 을 제안 특히나, 해당 논문은 FLO..