일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- UE5
- NLP
- GAN
- 언리얼엔진
- Few-shot generation
- Unreal Engine
- animation retargeting
- BERT
- deep learning
- 폰트생성
- WinAPI
- ue5.4
- CNN
- motion matching
- 딥러닝
- Diffusion
- userwidget
- ddpm
- 모션매칭
- multimodal
- 생성모델
- cv
- Font Generation
- Generative Model
- dl
- Stat110
- 오블완
- 디퓨전모델
- WBP
- RNN
- Today
- Total
Deeper Learning
Bayes' theorem Introduction 본문
조건부 확률
사건 B가 일어난 상황에서 사건 A가 발생할 확률
베이즈 통계학은 조건부 확률을 사용한 통계학
베이즈 정리
사전 확률로부터 사후 확률을 구할 수 있다.
베이즈 정리는 불확실성 하에서 의사결정문제를 수학적으로 다룰 때 중요하게 이용된다.
전통적인 확률이 연역적 추론에 기반을 두고 있다면 베이즈 정리는 확률임에도 귀납적, 경험적인 추론을 사용한다.
A는 관측을 통해 값을 알아낼 수 있는 대상이며, B는 불확실성 하의 계산 대상이라고 하면 B의 확률은 $P(B)$에서 $P(B|A)$로 변화하고, 베이즈 정리로 이 변화를 계산할 수 있다.
새로운 데이터가 들어왔을 때 앞서 계산한 사후 확률을 사전 확률로 사용하여 정보의 갱신을 통해 새로운 데이터의 정보를 반영한 갱신된 사후 확률을 구할 수 있다.
예제
발병률이 10%인 바이러스로 인한 질병 A가 있다. 바이러스에 감염된 사람을 정확히 검진할 확률은 99%, 감염되지 않은 사람을 감염되었다고 검진할 확률은 1%다. 질병 A에 걸렸다고 진단받은 환자가 실제로 질병 A에 걸렸을 확률은?
D = ( 질병 A에 걸렸다고 검진받는 사건 )
$\theta$ = ( 실제로 질병 A에 걸린 사건 )
사전확률 $P(\theta)$ = 0.1 (발병률이 10%)
$P(D|\theta)$ = 0.99 (정확히 검진할 확률 99%)
$P(D|not \theta)$ = 0.01 (오 검진 확률 1%, False Positive, 거짓 양성, 제1종 오류)
$P(D) = \sum_{\theta}^{}P(D|\theta)P(\theta) = 0.99 \times 0.1 + 0.01 \times 0.9 = 0.108$
$P(\theta|D)$는 양성으로 예측하였을 때 실제 양성인 확률을 구하는 것으로 Precision 구한 것이다.
False Alarm (오탐률)인 오검진 확률이 증가하면 정밀도는 떨어지게 된다.
베이즈 정리를 통해 새로운 정보를 반영한 확률을 계산할 수 있다.
위 문제에서 오검진 확률이 10%로 변이 한 질병 A 양성 검진을 받은 사람이 두 번째 검진을 받았을 때도 양성이 나왔을 때 이 환자가 실제 감염자일 확률을 구해보자.
앞서 구한 사후확률 $P(D|\theta)$ = 0.524을 사전 확률 $P(\theta^{*})$로 사용한다.
사전확률 $P(\theta^{*})$ = 0.524 ($P(D|\theta)$)
$P(D|\theta^{*})$ = 0.99 (정확히 검진할 확률 99%)
$P(D|not \theta^{*})$ = 0.1 (오 검진 확률 10%, False Positive, 거짓 양성, 제1종 오류)
$P(D^{*}) = \sum_{\theta^{*}}^{}P(D|\theta^{*})P(\theta^{*}) = 0.99 \times 0.524 + 0.1 \times 0.476= 0.566$
Reference
[1] Naver Boostcamp AI Tech 임성빈 교수님 - 베이즈 통계학 맛보기
'Statistics & Math' 카테고리의 다른 글
Eigenvector & Eigenvalue (0) | 2021.07.20 |
---|---|
Community Detection (0) | 2021.02.25 |
PageRank (0) | 2021.02.24 |
Graph (0) | 2021.02.23 |
Monte Carlo Method (0) | 2021.01.29 |