일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- Python
- assignment2
- SQLD
- DFS
- deep learning
- CNN
- Generative Models
- BFS
- Adam
- C++
- Regularization
- Optimization
- 밑바닥부터 시작하는 딥러닝2
- assignment1
- Alexnet
- Baekjoon
- do it! 알고리즘 코딩테스트: c++편
- Multi-Head Attention
- dropout
- Transformer
- RNN
- Machine Learning
- 밑바닥부터 시작하는 딥러닝
- mask r-cnn
- CPP
- marchine learning
- computer vision
- 딥러닝
- Algorithm
- cs231n
- Today
- Total
목록2. Artificial Intelligence/Seoul National Univ. Computer Vision (10)
newhaneul

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://www.youtube.com/watch?v=UfjZIe0aqVk&t=2s1. Score-based Generative Modeling: NCSN(Noise Conditional Score Network, 2019) Score-based Generative Modeling1. Score Matching 기반 생성데이터 분포 p(x)의 log probability density의 gradient를 학습하는 방식이 gradient를 score function s_θ라고 한다.2. Noise scale σ ..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/tFQYLT6itBw?si=_9-ADeRIqeu-Iawq GANs for Image-to-Image TranslationImage Translation Image translation task는 입력되는 이미지의 의미(형태)는 유지한 채 변환하고 싶은 이미지의 스타일로 입력 이미지를 변환하는 작업을 의미한다. 1. GANs for Image-to-Image Translation: Pix2pix (2016) Pix2pix은 입력으로 이미지 쌍 (x, y)를 받고, 도메인 X의 이미지 x를..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/ey-XRzU0b68?si=Uc8n2vgpCA5KmlHm Challenges with Evaluation Generative Model들은 classification 혹은 object detection과는 다르게 모델의 성능을 평가하는데 어려움을 겪는다. 생성된 이미지가 거의 실제와 비슷해지게 되면, 명확한 척도가 없기 때문에 사람의 주관성에 따라 성능 평가가 달라지는 문제가 생긴다. 즉, 인간의 지각과 완전히 일치하는 평가지표가 없다. 이미지 생성의 경우에는 현실에 없던 이미지를 모..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/iekD7bVE7J4?si=smvdZz0gXB2qh-W- Taxonomy of Generative Models 확률 분포를 어떻게 정하느냐에 따라 생성 모델의 성격이 달라진다. 만약 확률 분포를 명시하게 해주면 Explicit density estimation이라 하고, 데이터로부터 확률 분포를 학습하면 Implict density estimation 방법이다. Generative Modeling Generative Model은 실제 데이터의 확률 분포를 학습하여 생성 확률 분포를 만들..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/QtzaSZdmUrg?si=w5JvUazBk4bMdiMk Computer Vision Tasks Semantic Segmentations with CNNs Semantic Segmentation: Applications First Ideas for Semantic Segmentation Semantic Segmentation의 가장 단순한 아이디어는 Input image를 작은 patch단위로 분리하고 그 patch의 중심 pixel에 대해서 CNN을 진행시킨뒤 classificatio..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/CcZs5YT-Ar0?si=6fcR_verULfk5ng6 1. Object Detection Object Detection은 이미지나 영상에서 객체가 어느 위치에 있는지를 식별하는 유서 깊은 컴퓨터 비전 기술이다. 단순한 Classification과는 달리, 객체의 위치(Bounding Box)와 클래스(Label0을 함께 예측하는 것이 목표이다. 가장 단순한 Object detection은 입력 이미지를 CNN에 통과시키고 Class Loss와 Bounding Box Loss를 합산..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://www.youtube.com/watch?v=AsH4HRWMY7E&list=PL0E_1UqNACXBhqjwBzFQ88YXWotXrKRG-&index=13 1. Bidirectional Encoder Representations from Transformers(BERT, 2018) BERT는 사전학습 기반 자연어 처리 모델이다. Transformer Encoder 블록만 사용하며, 양방향(Bidirectional) attention을 수행하여 양쪽 문맥을 모두 고려한다. 기존의 단방향 모델들과는 다르게 완..

본 포스팅은 서울대학교 이준석 교수님의 M3224.000100 Machine Learning for Visual Understanding을 수강하고 공부한 내용을 정리하기 위한 포스팅입니다. https://youtu.be/p1fdYbs9W0c?si=4d87BJ3pcIUCCgV5 1. Attention Mechanism Attention Mechanism은 입력 시퀀스 중에서 중요한 부분에 집중(attend)하도록 학습하는 메커니즘이다. 즉, 모든 입력 요소 간의 상호작용을 계산하고, 중요한 정보에 더 많은 가중치를 부여한다. Query: Decoder hidden stateKey, Value: Encoder hidden stateAttention Value: Weighted average of enco..