플로라도의 data workout

EECS 498-007 : Deep Learning for Computer Vision 소개 본문

기초 노트/EECS 498-007 (ComputerVision)

EECS 498-007 : Deep Learning for Computer Vision 소개

플로라도 2024. 2. 14. 02:57

 
최근, 작년에 열심히 수강했던 cs231n의 내용을 완벽하게 까먹은 것을 깨닫고(?) 
복습 차원에서 EECS 498-007 : Deep Learning for Computer Vision 강좌의 슬라이드를 활용하여 관련 내용을 새로이 정리하고자 한다.
 
가장 유명한 딥러닝& 컴퓨터 비전 강좌인 스탠퍼드의 CS231n: Deep Learning for Computer Vision (2017)에 이어서
2019년 버전 "Deep Learning for Computer Vision"은 미시간 대학 유튜브에서 EECS 498-007이라는 강좌명으로 강의를 제공하고 있다.
동일한 강의자인 저스틴 존슨(Justin Johnson)이 강의를 진행하며, 내용면에서 업그레이드된 부분들이 있어,
매해 가파른 속도로 발전하는 인공지능 생태계를 감안하면
현 시점에서는 cs231n보다는 EECS-498로 학습하는게 더 낫지 않나 싶은 생각이다.
 
그는 스탠퍼드에서 박사학위를 마치고 얼마 지나지 않아 미시간 대학에 단기간에 교수로 임용된 것 같다. cs231n이 딥러닝 학습에 미친 영향력을 생각하면, 그럴만도 한 것 같다.
 
 

강좌 소개

아래의 링크를 통해 유튜브에서 무료로 제공하는 강의와 슬라이드를 확인할 수 있다.

Deep Learning for Computer Vision

Computer Vision has become ubiquitous in our society, with applications in search, image understanding, apps, mapping, medicine, drones, and self-driving car...

www.youtube.com

 
 
 
Computer Vision has become ubiquitous in our society, with applications in search, image understanding, apps, mapping, medicine, drones, and self-driving cars. Core to many of these applications are visual recognition tasks such as image classification and object detection. Recent developments in neural network approaches have greatly advanced the performance of these state-of-the-art visual recognition systems. This course is a deep dive into details of neural-network based deep learning methods for computer vision. During this course, students will learn to implement, train and debug their own neural networks and gain a detailed understanding of cutting-edge research in computer vision. We will cover learning algorithms, neural network architectures, and practical engineering tricks for training and fine-tuning networks for visual recognition tasks.
 
컴퓨터 비전은 검색(search), 이미지 이해(image understanding), 어플, 지도, 의료, 드론, 자율 주행 자동차 등 우리 사회 곳곳에서 활용되고 있다. 특별히 "has become ubiquitious" 유비쿼터스화 되었다고 말한다.
이러한 대부분의 응용에서는 이미지 분류(Image Classification)과 객체 탐지(Object detection)과 같은 visual recognition task가 핵심이다.
최근 신경망(neural net)의 발달로 인해, visual recognition 시스템의 최신 퍼포먼스는 크게 발전되었다.
본 강좌는 컴퓨터 비전을 위한 딥러닝을 기초로하여 신경망(neural-network)의 디테일을 심도 있게 다룬다.
이 과정에서 학생들은 neural-network의 구현, 훈련(train)과 디버깅을 학습하며 첨단 컴퓨터 비전 연구의 디테일한 이해를 할 수 있을 것이다.
강좌에서는 학습 알고리즘, 신경망 아키텍쳐, visual recognition을 위한 엔지니어링 트릭과 파인 튜닝(fine-tuning)방법을 다룬다.
 
 
 
 
본 강좌는 강의 뿐만 아니라 총 6개의 과제도 제공한다.
과제 파일은(https://web.eecs.umich.edu/~justincj/teaching/eecs498/WI2022/) 에서 확인할 수 있으며, 난이도는 상당한 것으로 알려져 있다.
어렵지만, 그만큼 실력 향상에 상당히 좋은 material로 정평이 나있다.  따라서 강의 수강과 함께 공개된 과제도 같이 해결하면 좋을 것이다.
 
 
 
 

작성 방향

최초의 작성 목적이 복습 용도이기도 하고
아무래도 강의를 듣고 나서, 개인적으로 중요한 부분들에 대하여 보충 및 추가 정리를 하기 때문에
본 강좌와 집중하는 부분이 다를 수 있을 것이다.
가능한 개념어는 한국말로 번역하기 보다는 영어 표현을 그대로 사용하였다.
EECS 498-007의 강의 수강 후 요약 정리하는 강의노트 용도로 활용될 수 있기를 바란다.