일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Generative Model
- Diffusion
- 폰트생성
- ddpm
- Few-shot generation
- dl
- 딥러닝
- Unreal Engine
- Font Generation
- 모션매칭
- deep learning
- ue5.4
- GAN
- WinAPI
- 오블완
- WBP
- motion matching
- Stat110
- UE5
- RNN
- multimodal
- CNN
- 언리얼엔진
- animation retargeting
- NLP
- 디퓨전모델
- userwidget
- cv
- 생성모델
- BERT
Archives
- Today
- Total
목록VisionTransformer (1)
Deeper Learning

Alexey Dosovitskiy et al., (2020), Google Research, Brain Team Abstract 사실상 Transformer 구조가 NLP task에서 standard가 되었지만 vision task에서는 아직 적용에 한계가 있었음 Transformer는 CNN을 대체하지 못하고 CNN의 일부 컴포넌트를 대체하는 식으로 결합하여 사용되고 있었음 이미지 분류 태스크에서 pure transformer로 좋은 성능을 낼 수 있음 large datasets에서 pre-trained 한 ViT 모델은 mid-sized or small image recognition(ImageNet, CIFAR-100, VTAB, etc)에서 더 적은 computational cost를 필요로 하면..
AI/Deep Learning
2021. 12. 17. 15:17