[ AI-Paper ] Distilling the Knowledge in NN

2024. 3. 27. 17:37·AI-Study/Base

Orin AGX에 올릴 OD모델 경량화를 위해 KD Method를 적용하려는데 원리를 깊게 알고싶어서 논문을 읽어보았다. 추후에는 코드에 직접 적용할 것이다. 

 

[ Abstract ]

  • 성능 향상을 위해서 모델 앙상블을 사용하면 계산량이 급격하게 증가한다.
  • 이럴 때 접근법: Compress the knowledge in an ensemble, 하나의 모델에 compression technique을 적용하는 것이다. 

[ 1. Introduction ]

  • Training stage & Deployment stage
  • "Cumbersome Model"이 train된 후에 distillation 사용하는 것이다. 
  • 여기서 말하는 Cumbersome 한 모델은 teacher 모델을 의미하고, Small한 모델은 student 모델이겠다.
  • Change the form of the model but keep the same knowledge인 셈임.

[ 2. Distillation ]

 

[ 3. MNIST에 적용한 초기 실험들 ]

 

[ 4. Speech Recognition에 적용한 실험들 ]

 

[ 5. Training ensembles of specialitsts on very big datasets ]

 

[ 6. Soft Targets as Regularizers ]

 

[ 7. Relationship to mixture of experts ]

 

[ 8. Discussion ]

'AI-Study > Base' 카테고리의 다른 글

[AI-Paper] VGGNet : Very Deep Convolutional Networks For Large-Scale Image Recognition  (0) 2023.11.05
'AI-Study/Base' 카테고리의 다른 글
  • [AI-Paper] VGGNet : Very Deep Convolutional Networks For Large-Scale Image Recognition
뚱이, not a starfish
뚱이, not a starfish
M.S. Student,. Mainly interested in computer vision and autonomous cars
  • 뚱이, not a starfish
    Wilbur-Babo
    뚱이, not a starfish
  • 전체
    오늘
    어제
    • 분류 전체보기 (194)
      • 통신 및 네트워크 (12)
      • Embedded Projects (2)
      • 3D Reconstruction (1)
        • Gaussian Splatting (0)
        • 3D-GS (1)
        • Multi-view Geometry (0)
        • VSLAM (0)
        • Computer Graphics (0)
      • LLM(VLM) (0)
      • AI-Study (28)
        • Mono-Depth (7)
        • Base (2)
        • Computer Vision (1)
        • Image Processing (3)
        • Tiny Object Detection (3)
      • 자율주행 (20)
        • [2023] 1-fifth AA EV (4)
        • [2022] 1-tenth AA EV (2)
        • ROS 1,2 (4)
        • 이론 (7)
        • 실습 (3)
      • Pointcloud (0)
      • sw (16)
        • 정보보안 (1)
        • Android_develop (3)
      • [학부] 전기전자공학 (12)
        • 반도체 (2)
        • 마이크로프로세서 (6)
      • 코딩테스트 (22)
        • BOJ (21)
      • 취준 (21)
        • EVS37 Ambassador (5)
        • 차량 제어 플랫폼 (5)
        • 영어 (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    rc카
    evs37 sdv
    현대자동차최종면접결과
    현대자동차 자율주행 서류 합격 후기
    자율주행시험
    tar압축풀기
    현차 자율주행
    헤네스유아용자동차
    심포지움
    현대자동차 연구개발
    EVS37
    tar 파일
    evs37sdv
    현대차3월신입후기
    자율주행
    현대자동차 서류합격후기
    자율주행자동차
    헤네스
    오블완챌린지
    자율주행경진대회
    오픽후기
    현차 3월 자율주행
    현차떨
    자율주행작품
    현대자동차 자율주행
    software defined vehicle
    우분투터미널
    현차 3월 신입 서류
    현대자동차최종불합
    정렬
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
뚱이, not a starfish
[ AI-Paper ] Distilling the Knowledge in NN
상단으로

티스토리툴바