[AI-Paper] VGGNet : Very Deep Convolutional Networks For Large-Scale Image Recognition
·
AI-Study/Base
VGGNet (2014)는 옥스퍼드 대학의 VGG(Visual Geometry Group) 팀이 개발한 CNN 구조로 2014년 이미지넷 챌린지에서 우수한 성과를 얻은 구조임, VGGNet은 많은 연구에서 베이스라인으로 사용됨 (ICLR 2015) 차후의 공부나 연구에서 반드시 필요할 것 같아서 정리해보기로함. ICLR 2015 1. Introductions 이미지넷 챌린지를 통해서 비전 모델들이 도전하였는데 high-dimensional shallow feature encodings 부터 deep ConvNet까지 다양한 large-scale image classification system들을 실험할 수 있었다. 이 논문은 CNN에서 depth가 어떤 방식으로 성능에 관여하는가를 보여주기 위함이다. ..
ImageNet Challenge
·
AI-Study
128만 훈련, 5만 검증, 10만 테스트 데이터로 1000종으로 사진을 분류하는 문제이다. 2012년 AlexNet부터 CNN활용을하였음
Argparse 라이브러리에 대하여
·
sw
우선 '파싱'이란 무엇일까? cs적인 부분으로 생각해보았을 때 주로 문자열이나 파일의 내용을 읽고, 그 구조나 의미를 분석하여 사용자나 프로그램이 원하는 형태로 변환하는 것을 가리킨다. -> 터미널 인자를 읽고, 그 인자들의 의미와 구조를 이해하고, 이를 프로그램 내에서 사용 가능한 형태로 변환하는 과정을 가리킨다. parser는 argparse.ArgumentParser( )로 생성된 객체의 참조인다. 이 'Parser' 객체는 주로 두 가지 주요 역할을 함. 1. 인자 정의 : add_argument 메서드를 통해서 인자의 이름이나 타입, 기본값, 도움말 메시지 등을 지정할 수 있다. 2. 인자 파싱: parse_args 메서드로 터미널에서 제공된 인자를 파싱한다. 지금 내가 헷갈리는 점은 train..
CUDA 11.6 Pytorch3d Install 설치 방법
·
sw
https://github.com/facebookresearch/pytorch3d/blob/main/INSTALL.md 5시간을 왜 pytorch3d가 install이 안돼서 끙끙됐는데 알고보니 굉장히 간단한걸 깨달았다. 분명 위의 사이트를 그대로 따라하면 된다는 건 다들 알고있겠지. 하지만, 그대로 따라할 때 내가 놓친 부분이 있다. 아래에 설명하였다. pytorch3d를 깔려면 cuda10.1이 필요하다는 오해가 있을 수 있는데 사실 상관 ㄴㄴ함. CUDA11.6도 가능 1. CUDA 11.6 2. Python 3.9 3. Pytorch 1.13.0 # Step1. 위 사이트 그대로 다운받는다. conda create해서 도화지에서 시작하기 conda create -n pytorch3d python=..
옵시디언 그래프 뷰
·
카테고리 없음
딥러닝을 공부하던 중 수 많은 개념들이 계속 만들어지고 배웠던 개념들이 반복되어 나오는 것의 연속이다. 이 때 중요한 것은 배웠던 개념을 잘 정리해 쉽게 꺼내 읽을 수 있는 편리함이라고 생각한다. 옵시디언의 그래프 뷰로 종속적인 관계를 나타낼 수 있다. 머리속에서 잘 정돈 되지 않았던 스키마를 직접 그릴 수 있다는 점에서 굉장히 도움되는 툴인 것 같다.