일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- deep learning
- 언리얼엔진
- Few-shot generation
- 모션매칭
- NLP
- 생성모델
- Font Generation
- UE5
- ddpm
- ue5.4
- BERT
- CNN
- userwidget
- cv
- motion matching
- 폰트생성
- 딥러닝
- Stat110
- animation retargeting
- dl
- 디퓨전모델
- multimodal
- 오블완
- WinAPI
- Generative Model
- RNN
- GAN
- WBP
- Diffusion
- Unreal Engine
- Today
- Total
Deeper Learning
[Statistics 110] Lecture 15: Midterm Review 본문
[Statistics 110] Lecture 15: Midterm Review
Dlaiml 2022. 12. 17. 16:28Coupon Collector
뽑기 상품에서 같은 확률로 등장하는 n개 종류의 장난감이 있다. 이를 모두 수집하기 위해 뽑기를 평균 몇 번 해야할까?
Tj를 j 번째 장난감을 얻기까지의 시도 횟수라고 하자
T=T1+T2+...+Tn.
T1은 무엇이든 뽑으면 바로 성공이기 때문에 1이고, T2는 이제 성공확률이 n/n(n-1)인 시행이 되어 기하분포로 표현이 가능 T2−1∼Geom(n−1n).
일반화한 식은
Tj−1∼Geom(n−(j−1)n)E(T)=E(T1)+...+E(Tn)=1+nn−1+...+n1=n(1+12+...+1n)
n이 충분히 크다면 조화급수를 log가 포함된 식으로 근사가능 (=nlogn)
Universality of Uniform distribution(균등분포의 보편성)

X는 cdf F를 따른다
X를 자기자신의 cdf인 F에 넣으면 균등분포가 나온다.
F(x)=1/3인 지점을 고르고 x를 x0이라고 하자
F(x0)=13P(F(X)≤13)=P(X≤x0)=F(x0)=13
P(F(X)≤13)=13으로 F(X)는 길이와 확률이 비례하는 균등분포다
F(X)∼Unif(0,1)
로지스틱 분포를 균등분포의 보편성을 통해 나타내보면
F(X)=ex1+exF−1(u)=logu1−u
F−1(u)를 사용해서 균등분포를 샘플링 함으로써 로지스틱 분포에서 샘플링이 가능
Linearity
r.v X,Y,Z가 iid이며 양의 값을 가질 때, E(XX+Y+Z)를 구하시오.
대칭성에 의해
E(XX+Y+Z)=E(YX+Y+Z)=E(ZX+Y+Z)E(XX+Y+Z)=E(YX+Y+Z)+E(ZX+Y+Z)=1E(XX+Y+Z)=1
LOTUS
u∼unif(0,1),X=u2,Y=eXfind E(Y) as ∫
fX(x)가 X의 pdf라면 E(Y)=∫10exfX(x)dx로 LOTUS에 의해 표현이 가능
그 후 X의 P(u2≤x)=P(u≤√x)=√x 식으로 cdf를 구하고 미분해서 pdf를 구하며 식을 풀어나가도 되지만 아래 식과 같이 한 번에 수식을 정리할 수도 있음
E(Y)=∫10eu2fu(u)du=∫10eu21du
Story
X∼Bin(n,p), n−X의 분포를 구해라
이항분포의 pmf에서 식을 전개하면
P(n−X=k)=P(X=n−k)=(nn−k)pn−kqk=(nk)qkpn−k
story의 직관으로도 바로 풀 수 있는데, 이항분포는 독립적인 n번의 베르누이 시행에서 성공 횟수를 나타내기 때문에 n-X는 실패 횟수를 나타내는 확률변수이기 때문에 p와 q를 바꾸면 n−X∼Bin(n,q)로 바로 답이 나오게된다
Poisson Distribution
일정시간 t동안 받은 이메일의 개수가 Pois(λt)를 따른다.
첫 번째 이메일을 받는 시간을 나타내는 확률변수가 T라고 하면 T의 pdf를 구하시오
t 시간까지 메일을 하나도 받지 않을 확률은 P(Nt=0)=P(T>t)로 표현할 수 있음
0개의 메일을 t시간 동안 받을 확률을 포아송분포의 pmf를 사용하여 구하면
e−λt(λt)00!=e−λt
T의 CDF는 1−e−λt와 같고 이를 미분하여 pdf를 구할 수 있다
Reference
[0] https://www.youtube.com/playlist?list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo
Statistics 110: Probability
Statistics 110 (Probability) has been taught at Harvard University by Joe Blitzstein (Professor of the Practice in Statistics, Harvard University) each year ...
www.youtube.com
'Statistics & Math > Statistics 110: Probability' 카테고리의 다른 글
[Statistics 110] Lecture 17: Moment Generating Functions (0) | 2022.12.24 |
---|---|
[Statistics 110] Lecture 16: Exponential Distribution (0) | 2022.12.24 |
[Statistics 110] Lecture 14: Location, Scale, and LOTUS (0) | 2022.12.17 |
[Statistics 110] Lecture 13: Normal Distribution (0) | 2022.12.10 |
[Statistics 110] Lecture 12: Discrete vs. Continuous, the Uniform (0) | 2022.12.10 |