Deeper Learning

[Statistics 110] Lecture 22: Transformations and Convolutions 본문

Statistics & Math/Statistics 110: Probability

[Statistics 110] Lecture 22: Transformations and Convolutions

Dlaiml 2022. 12. 25. 17:41

초기하분포 분산

저번 강의에 이어서 식 정리

Var(X)=Var(X1+...+Xn)=Var(X1)+...+Var(Xn)+2i<jCov(Xi,Xj)np(1p)+2(n2)(w(w1)(w+b)(w+b1)p2)=NnN1np(1p)

NnN1은 비복원 추출에 따른 조정값으로 N=w+b이고 n이 1이면 베르누이분포의 분산과 같아지며, N이 매우크면 조정값이 거의 1과 같아 이항분포와 비슷한 성질을 가진다(복원과 비복원이 비슷)

Transformations

LOTUS를 통해 어떤 함수 g에 의해 변환된 확률변수의 기댓값을 구할 수 있었다.

변환된 후 확률분포를 얻으려면 어떻게 해야할까?

X를 pdf가 fx인 연속확률변수라고 하고, Y=g(X)라고 하자. (g는 미분가능한, 증가함수)

Y의 pdf는 fY(y)=fX(x)dxdy가 된다. (y=g(x),x=g1(y))

Proof)

P(Yy)=P(g(X)y)=P(Xg1(y))=FX(g1(y))=FX(x)

pdf를 구하기 위해 y로 미분을 하면

fY(y)=fX(x)dxdy

예시, 표준 log-normal 분포)

Y=eZ, ZN(0,1)

Z=ln(Y)fY(y)=fX(x)dxdy=12πeln(y)2dxdy

dydzezy와 같기 때문에 식을 이어서 풀면

fY(y)=12πeln(y)21y

Multidimensional Transformations

Y=g(X),g:\Rn\Rn.

fY(y)=fX(x)|dxdy|

|dxdy|는 Jacobian의 determinant의 절댓값

Convolution

T=X+Y이고 X,Y가 독립이라고 하면

P(T=t)=XP(T=t|X=x)P(X=x)=XP(X+Y=t|X=x)P(X=x)=XP(Y=tx)P(X=x)

fT(t)=FX(x)FY(tx)dx

CDF

FT(t)=P(Tt)=inf

CDF에서 양변을 미분하면 PDF를 구할 수 있음

Shannon’s Noisy Channel Coding Theorem

Idea: 어떤 특성 A를 가진 물체의 존재를 확률로 증명

A는 물체가 특성 A를 가지는 사건

어떤 물체애 대해 P(A) >0임을 보이면 된다.

각 물체에 “점수”가 있다고 가정한다. 좋은 점수(평균 이상)의 점수를 가지는 object는 무조건 1개 이상 존재한다.

예시) 100명의 사람들, 15개의 위원회가 있고 한 사람이 3개에 위원회에 속해있다면 겹치는 사람이 3명보다 많은 위원회가 존재한다는것을 보여라

임의의 두 위원회에서 겹치는 사람의 기댓값을 구하자.

사람 j가 특정 위원회 2개에 동시에 속해있는 사건을 나타내는 지시확률변수 X_j를 설정

X_j = \frac{\binom32}{\binom{100}2} \\ E(X) = E(X_1)+...+E(X_{100}) = 100\frac{\binom32}{\binom{100}2} =\frac{20}7\approx 3

즉 적어도 겹치는 사람이 2.88명 이상인 위원회가 존재한다는 것이기 때문에 겹치는 사람이 3명이상인 위원회는 반드시 존재한다.

 

Reference

[0] https://www.youtube.com/playlist?list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo 

 

Statistics 110: Probability

Statistics 110 (Probability) has been taught at Harvard University by Joe Blitzstein (Professor of the Practice in Statistics, Harvard University) each year ...

www.youtube.com