VGGNet (2014)는 옥스퍼드 대학의 VGG(Visual Geometry Group) 팀이 개발한 CNN 구조로 2014년 이미지넷 챌린지에서 우수한 성과를 얻은 구조임, VGGNet은 많은 연구에서 베이스라인으로 사용됨 (ICLR 2015)
차후의 공부나 연구에서 반드시 필요할 것 같아서 정리해보기로함. ICLR 2015
1. Introductions
이미지넷 챌린지를 통해서 비전 모델들이 도전하였는데 high-dimensional shallow feature encodings 부터 deep ConvNet까지 다양한 large-scale image classification system들을 실험할 수 있었다.
이 논문은 CNN에서 depth가 어떤 방식으로 성능에 관여하는가를 보여주기 위함이다. 다른 파라미터들을 고정시키고 점진적으로 conv layer를 쌓아가며 실험하는 방식을 사용하였다. 이 방식은 매우 작은 (3x3) receptive field인 conv window를 사용하였기 때문에 depth를 깊이있게 하는것이 구현 가능했다.
2. 제안하는 ConvNet Configurations
3. 학습과 평가에 대한 이미지 분류에 대한 상세내용
4. 비교와 결과
weight의 20퍼센트 정도가 deep conv부분을 차지하고 80퍼센트 정도가 MLP에 의존한다. MLP에 의존적인 모델임
-> 나중에는 FC를 한 층만 쓰도록 한다. MLP에 의존하지 않고 CNN의 효과를 최대로 볼 수 있다.
'AI-Study > Base' 카테고리의 다른 글
[ AI-Paper ] Distilling the Knowledge in NN (0) | 2024.03.27 |
---|