Deeper Learning

[Statistics 110] Lecture 12: Discrete vs. Continuous, the Uniform 본문

Statistics & Math/Statistics 110: Probability

[Statistics 110] Lecture 12: Discrete vs. Continuous, the Uniform

Dlaiml 2022. 12. 10. 12:33

Probability Density Function(PDF)

정의

확률변수 X가 모든 a,b에 대해 P(aXb)=baf(x)dx 를 만족시키면, X는 확률밀도함수(PDF) fX(x)를 가짐

a=b라면 적분값은 0 = 특정 값을 가질 확률은 0

pmf와 마찬가지로 음수가 아니며, 모든 구간에 대해 적분하면 1이 되어야 함

 

Density의 의미

CDF와 PDF의 관계

FX(x)=P(Xx)=x\infinf(t)dt

pdf fX(x)=cdf F(x)

기댓값

E(X)=\infin\infinxfX(x)dx

분산, 표준편차

Var(x)=E((XE(X))2)=E(X2)(E(X))2

SD(X)=Var(X)

Uniform Distribution(균등분포)

Unif(a,b)는 [a,b] 범위에서 랜덤 포인트의 위치

확률이 범위와 비례하는 분포

pdf

f(x) = c (if a ≤ x ≤b) otherwise 0

(a~b로 적분하면 1이 나와야 한다 → c = 1 / (b-a)

cdf

F(x) = 0 (if x < a), 1 (if x > b), (x-a) / (b-a) (if a ≤ x ≤ b)

Expected value

E(X)=baxbadx=a+b2

Variance

X의 제곱의 기댓값을 알아야 계산이 가능, Y=X2 라고 하면

E(X2)=E(Y)

E(X)=\infin\infinxfX(x)dx

E(X2)=\infin\infinx2fX(x)dx

X2의 기댓값을 구하지 않고 X가 따르는 pdf를 그대로 사용하고 앞의 값만 X2으로 바꾼 세 번째 식은 성립한다.

이를 Law of the unconscious statistician(LOTUS, 무의식적인 통계학자의 법칙)이라고 부른다.

일반화한 수식은 아래와 같다. (임의의 함수 g)

E(g(X))=\infin\infing(x)fX(x)dx,xg(x)P(X=x)

u가 0~1 범위의 uniform distribution을 따르는 확률변수라고 하자

E(u)=1/2E(u2)=10u2fu(u)du=1/3Var(u)=E(u2)E(u)2=1/12

Universality of the uniform distribution

u가 0~1 범위의 uniform distribution을 따르는 확률변수라고 하자

F는 CDF (증가하는 연속함수로 가정, 역함수가 존재)

XF1(u)라고 하면 확률변수 XF를 따른다

 

proof)

증가하는 연속함수라 부등식 양변에 F를 적용할 수 있음

P(Xx)=P(F1(u)x)=P(F(F1(u))F(x))=P(uF(x))

u는 0~1 범위 내에 있기 때문에

범위 내 일정 지점까지의 확률은 해당 길이와 같다

  • u가 0.5에 위치한 점보다 왼쪽에 있을 확률은 0.5

따라서 P(uF(x))=F(x)

 

Reference

[0] https://www.youtube.com/playlist?list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo 

 

Statistics 110: Probability

Statistics 110 (Probability) has been taught at Harvard University by Joe Blitzstein (Professor of the Practice in Statistics, Harvard University) each year ...

www.youtube.com

 

Comments