Deeper Learning

Bayes' theorem Introduction 본문

Statistics & Math

Bayes' theorem Introduction

Dlaiml 2021. 2. 1. 20:01

조건부 확률

 

 

사건 B가 일어난 상황에서 사건 A가 발생할 확률

베이즈 통계학은 조건부 확률을 사용한 통계학

 

베이즈 정리

 

 

사전 확률로부터 사후 확률을 구할 수 있다.

베이즈 정리는 불확실성 하에서 의사결정문제를 수학적으로 다룰 때 중요하게 이용된다.

전통적인 확률이 연역적 추론에 기반을 두고 있다면 베이즈 정리는 확률임에도 귀납적, 경험적인 추론을 사용한다.

 

A는 관측을 통해 값을 알아낼 수 있는 대상이며, B는 불확실성 하의 계산 대상이라고 하면 B의 확률은 $P(B)$에서 $P(B|A)$로 변화하고, 베이즈 정리로 이 변화를 계산할 수 있다.

 

새로운 데이터가 들어왔을 때 앞서 계산한 사후 확률을 사전 확률로 사용하여 정보의 갱신을 통해 새로운 데이터의 정보를 반영한 갱신된 사후 확률을 구할 수 있다.

 

예제

발병률이 10%인 바이러스로 인한 질병 A가 있다. 바이러스에 감염된 사람을 정확히 검진할 확률은 99%, 감염되지 않은 사람을 감염되었다고 검진할 확률은 1%다. 질병 A에 걸렸다고 진단받은 환자가 실제로 질병 A에 걸렸을 확률은?

 

D = ( 질병 A에 걸렸다고 검진받는 사건 )

$\theta$ = ( 실제로 질병 A에 걸린 사건 )

사전확률 $P(\theta)$ = 0.1 (발병률이 10%)

$P(D|\theta)$ = 0.99 (정확히 검진할 확률 99%)

$P(D|not \theta)$ = 0.01 (오 검진 확률 1%, False Positive, 거짓 양성, 제1종 오류)

$P(D) = \sum_{\theta}^{}P(D|\theta)P(\theta) = 0.99 \times 0.1 + 0.01 \times 0.9 = 0.108$

$P(\theta|D)$는 양성으로 예측하였을 때 실제 양성인 확률을 구하는 것으로 Precision 구한 것이다.

False Alarm (오탐률)인 오검진 확률이 증가하면 정밀도는 떨어지게 된다.

 

조건부확률 시각화

 

 

베이즈 정리를 통해 새로운 정보를 반영한 확률을 계산할 수 있다.

위 문제에서 오검진 확률이 10%로 변이 한 질병 A 양성 검진을 받은 사람이 두 번째 검진을 받았을 때도 양성이 나왔을 때 이 환자가 실제 감염자일 확률을 구해보자.

앞서 구한 사후확률 $P(D|\theta)$ = 0.524을 사전 확률 $P(\theta^{*})$로 사용한다.

 

사전확률 $P(\theta^{*})$ = 0.524 ($P(D|\theta)$)

$P(D|\theta^{*})$ = 0.99 (정확히 검진할 확률 99%)

$P(D|not \theta^{*})$ = 0.1 (오 검진 확률 10%, False Positive, 거짓 양성, 제1종 오류)

$P(D^{*}) = \sum_{\theta^{*}}^{}P(D|\theta^{*})P(\theta^{*}) = 0.99 \times 0.524 + 0.1 \times 0.476= 0.566$

Reference

[1] Naver Boostcamp AI Tech 임성빈 교수님 - 베이즈 통계학 맛보기

 

'Statistics & Math' 카테고리의 다른 글

Eigenvector & Eigenvalue  (0) 2021.07.20
Community Detection  (0) 2021.02.25
PageRank  (0) 2021.02.24
Graph  (0) 2021.02.23
Monte Carlo Method  (0) 2021.01.29
Comments