일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 모션매칭
- ue5.4
- userwidget
- RNN
- animation retargeting
- BERT
- CNN
- 폰트생성
- GAN
- ddpm
- multimodal
- 생성모델
- 디퓨전모델
- Diffusion
- deep learning
- Stat110
- WinAPI
- Unreal Engine
- WBP
- dl
- Font Generation
- NLP
- Generative Model
- 딥러닝
- 언리얼엔진
- cv
- UE5
- 오블완
- Few-shot generation
- motion matching
Archives
- Today
- Total
Deeper Learning
[Statistics 110] Lecture 8: Random Variables and Their Distributions 본문
Statistics & Math/Statistics 110: Probability
[Statistics 110] Lecture 8: Random Variables and Their Distributions
Dlaiml 2022. 12. 8. 21:48Binomial Distribution
Story
- n번의 독립적인 Bern(p) 시행에서 성공 횟수
Sum of Indicator Random Variables
- $X = X_1+X_2+...+X_n$
- $X_j$는 trial이 성공하면 1, 그렇지 않으면 0으로 2개의 값을 가질 수 있음
- $X_j$는 independent identically distributed(i.i.d)
확률분포와 확률변수의 구분
- 확률변수는 수학적으로 함수
- $X_j$는 시행이 성공하면 1, 아니면 0
- 확률분포는 $X$가 어떻게 다르게 행동할지에 대한 확률을 말함
- 같은 분포를 가진 확률변수가 여럿 존재 가능
- i.i.d condition에서 확률변수들은 같은 분포를 가지지만 다른 값이 될 수 있음
PMF
- $X$가 특정값을 가질 확률을 수식으로 나타낸 것
- $P(X=k) = \binom{n}{k}p^k(1-p)^{(n-k)}$
CDF(cumulative distribution function)
- pmf에서 X=k가 사건인것처럼 X ≤ k도 하나의 사건
- $F(X) = P(X\le x)$이면 $F$는 $X$의 cdf
Binomial Distribution
두 이항분포의 합
$X+Y \sim Bin(n+m,p)$
- Story 관점: 동전던지기를 X, Y에서 시행하고 성공횟수를 더한 것
- Sum of Indicator Random Variables 관점
- $X+Y = \sum X_j + \sum Y_i$
- 위 식은 곧 n+m개의 i.i.d Bern(p)와 같기 때문에 정의에 따라 Bin(n+m,p)
- pmf 관점
- $X$에 대해 조건을 세우는 방식으로 식을 전개
$$ P(X+Y = k) = \sum_{j=0}^{k}P(X+Y=k|X=j)P(X=j) = \sum_{j=0}^{k}P(Y=k-j|X=j)\binom{n}{j}p^jq^{n-j} $$
- 독립의 정의를 활용하고 식을 이어 전개하면
$$ =\sum_{j=0}^{k}\binom{m}{k-j}p^{k-j}q^{m-k+j}\binom{n}{j}p^jq^{n-j} = p^kq^{m+n-k}\sum_{j=0}^{k}\binom{m}{k-j}\binom{n}{j} $$
- 이전에 배운 Vandermonde 항등식을 활용하면
$$ =p^kq^{m+n-k}\binom{m+n}{k} $$
식을 보면 시행횟수가 m+n, 확률이 p인 이항분포의 pmf와 일치하기 때문에 $X+Y$는 이항분포를 따르는 것이 증명됨
이항분포가 아닌 경우
- 52개 카드에서 5개 카드를 랜덤으로 뽑을 때 에이스 카드 수의 분포. (확률변수 $X$를 ace 카드의 수로 정의)
$$ P(X=k) = \frac{\binom{4}{k}\binom{48}{5-k}}{\binom{52}{5}} \space for \space k \space in \space \{0,1,2,3,4\} $$
- 검은 구슬 b, 흰 구슬 w개가 들어있는 상자에서 n개를 뽑을 때 뽑힌 흰 구슬의 개수의 분포 (단 0≤k≤w, 0≤n-k≤b)
$$ P(X=k) = \frac{\binom{w}{k}\binom{n}{n-k}}{\binom{w+b}{n}} \space $$
Hypergeometric distribution
- 위 카드, 구슬 예제는 비복원 표본추출로 이항분포와 다른 초기하분포
- 복원하지 않기 때문에 각 시행은 독립이 아니며 이항분포가 될 수 없음
- 만약 구슬이 매우 많다면 복원이 미치는 영향이 적어 초기하분포가 이항분포에 더 가깝게 근사될 수 있음
Reference
[0] https://www.youtube.com/playlist?list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo
'Statistics & Math > Statistics 110: Probability' 카테고리의 다른 글
Comments