일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- mask r-cnn
- Generative Models
- Algorithm
- RNN
- Transformer
- marchine learning
- Baekjoon
- assignment2
- computer vision
- DFS
- 밑바닥부터 시작하는 딥러닝2
- Python
- 밑바닥부터 시작하는 딥러닝
- BFS
- Optimization
- do it! 알고리즘 코딩테스트: c++편
- Adam
- Regularization
- deep learning
- assignment1
- dropout
- cs231n
- CPP
- CNN
- Alexnet
- Machine Learning
- 딥러닝
- C++
- SQLD
- Multi-Head Attention
- Today
- Total
목록2. Artificial Intelligence/Seoul National Univ. Computer Vision (10)
newhaneul

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/xXG5LV7mmcc?si=mEl00P-RJN1hMMrX 1. 3D Convolution 3D convolution은 영상이나 시계열처럼 시간/깊이 축을 포함한 3차원 데이터를 처리하기 위한 합성곱 연산이다. 입력은 일반적으로 다음과 같은 5차원 텐서로 구성된다.N: 배치 크기D: 깊이(시간축)H, W: 높이, 너비C: 입력 채널 수 커널의 텐서는 아래와 같다.k_D, k_H, k_W: 깊이, 높이, 너비 방향 커널 크기C_in: 입력 채널 수C_out: 출력 채널 수(필터 개수) 출..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://www.youtube.com/watch?v=dm2MCZ1QNH0&list=PL0E_1UqNACXBhqjwBzFQ88YXWotXrKRG-&index=10 1. Video Understanding Video classification은 입력으로 주어진 video clip에 대해 그 내용이 무엇인지 label을 예측하는 컴퓨터 비전 task를 말한다. image classification과는 다르게 여러 pixel들에 담겨있는 action을 바탕으로 label을 분류한다. query가 입력으로 주어지면 이..