Deeper Learning

[Statistics 110] Lecture 15: Midterm Review 본문

Statistics & Math/Statistics 110: Probability

[Statistics 110] Lecture 15: Midterm Review

Dlaiml 2022. 12. 17. 16:28

Coupon Collector

뽑기 상품에서 같은 확률로 등장하는 n개 종류의 장난감이 있다. 이를 모두 수집하기 위해 뽑기를 평균 몇 번 해야할까?

Tj를 j 번째 장난감을 얻기까지의 시도 횟수라고 하자

T=T1+T2+...+Tn.

T1은 무엇이든 뽑으면 바로 성공이기 때문에 1이고, T2는 이제 성공확률이 n/n(n-1)인 시행이 되어 기하분포로 표현이 가능 T21Geom(n1n).

일반화한 식은

Tj1Geom(n(j1)n)E(T)=E(T1)+...+E(Tn)=1+nn1+...+n1=n(1+12+...+1n)

n이 충분히 크다면 조화급수를 log가 포함된 식으로 근사가능 (=nlogn)

Universality of Uniform distribution(균등분포의 보편성)

X는 cdf F를 따른다

X를 자기자신의 cdf인 F에 넣으면 균등분포가 나온다.

F(x)=1/3인 지점을 고르고 xx0이라고 하자

F(x0)=13P(F(X)13)=P(Xx0)=F(x0)=13

P(F(X)13)=13으로 F(X)는 길이와 확률이 비례하는 균등분포다

F(X)Unif(0,1)

로지스틱 분포를 균등분포의 보편성을 통해 나타내보면

F(X)=ex1+exF1(u)=logu1u

F1(u)를 사용해서 균등분포를 샘플링 함으로써 로지스틱 분포에서 샘플링이 가능

Linearity

r.v X,Y,Z가 iid이며 양의 값을 가질 때, E(XX+Y+Z)를 구하시오.

대칭성에 의해

E(XX+Y+Z)=E(YX+Y+Z)=E(ZX+Y+Z)E(XX+Y+Z)=E(YX+Y+Z)+E(ZX+Y+Z)=1E(XX+Y+Z)=1

LOTUS

uunif(0,1),X=u2,Y=eXfind E(Y) as 

fX(x)X의 pdf라면 E(Y)=10exfX(x)dx로 LOTUS에 의해 표현이 가능

그 후 XP(u2x)=P(ux)=x 식으로 cdf를 구하고 미분해서 pdf를 구하며 식을 풀어나가도 되지만 아래 식과 같이 한 번에 수식을 정리할 수도 있음

E(Y)=10eu2fu(u)du=10eu21du

Story

XBin(n,p), nX의 분포를 구해라

이항분포의 pmf에서 식을 전개하면

P(nX=k)=P(X=nk)=(nnk)pnkqk=(nk)qkpnk

story의 직관으로도 바로 풀 수 있는데, 이항분포는 독립적인 n번의 베르누이 시행에서 성공 횟수를 나타내기 때문에 n-X는 실패 횟수를 나타내는 확률변수이기 때문에 p와 q를 바꾸면 nXBin(n,q)로 바로 답이 나오게된다

Poisson Distribution

일정시간 t동안 받은 이메일의 개수가 Pois(λt)를 따른다.

첫 번째 이메일을 받는 시간을 나타내는 확률변수가 T라고 하면 T의 pdf를 구하시오

t 시간까지 메일을 하나도 받지 않을 확률은 P(Nt=0)=P(T>t)로 표현할 수 있음

0개의 메일을 t시간 동안 받을 확률을 포아송분포의 pmf를 사용하여 구하면

eλt(λt)00!=eλt

T의 CDF는 1eλt와 같고 이를 미분하여 pdf를 구할 수 있다

 

Reference

[0] https://www.youtube.com/playlist?list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo 

 

Statistics 110: Probability

Statistics 110 (Probability) has been taught at Harvard University by Joe Blitzstein (Professor of the Practice in Statistics, Harvard University) each year ...

www.youtube.com