728x90

2023-10-18 30th Class

여러 클래스 및 현상의 베이즈 정리

Excercise 1. 출생아 성비 (class가 3개인 경우)

#️⃣ 표준 통계학 관점의 데이터
출생아 성비가 아래와 같다고 가정
남아: 여아 = 51:49

  • Bayes theorem에서는 특정 부부의 관점에서 추정할 수 있음

#️⃣ 여아 출산 기준의 Class 구분(y)
여아를 더 잘 출산하는 부부 -> P1 = 0.6
여아, 남아가 비슷한 경우 -> P2 = 0.5
남아를 더 잘 출산하는 부부 -> P3 = 0.4

#️⃣ pic

Drawing 2023-10-18 10.08.24.excalidraw.png

  • class는 여아를 더 잘 출산, 여아 남아 비슷, 남아를 더 잘 출산하는 부부 총 3가지 케이스로 각각 1/3 씩의 확률로 세팅 됨
  • 1/3 등분이 된 각 면적에서 파란색 부분은 여아를 출산할 확률로 (P=0.6)
  • 각 파란색 실면적은 여아를 출산한 경우로 윗변인 1/3 x 좌변인 0.6, 0.5, 0.4를 각각 곱한 6/30(=0.2), 5/30(=0.1666), 4/30(=0.1333)임
  • 각 빨간색 실면적은 남아를 출산한 경우로 윗변인 1/3 x 좌변인 0.4, 0.5, 0.6을 각각 곱한 4/30(=0.1333), 5/30(=0.1666), 6/30(=0.2)임

#️⃣ likelihood (class 기준 info의 확률)

  • 각 클래스 별로 likelihood를 2개씩 가지고 있음

#️⃣ posterior (info 기준 class의 확률)

Excercise 2. 스팸메일 (info가 2개인 경우)

#️⃣ 표준 통계학 관점의 데이터
스팸메일(SPAM)과 일반메일(HAM)의 비율
Spam : Ham = 0.5 : 0.5

#️⃣ 스팸 메일 기준의 Class 구분(y)
기준1
Link가 있는 메일이 스팸일 경우 = 0.6
Link가 있는 메일이 일반메일일 경우 = 0.2

기준 2
Word가 있는 메일이 스팸일 경우 = 0.4
Word가 있는 메일이 일반메일일 경우 = 0.05

이 경우에
(1) Link 기준으로 Bayes Theorem 값 -> P(S|L) = 0.75
(2) Word 기준으로 Bayes Theorem 값 -> P(S|W) = 0.89
(3) Link와 Word를 모두 고려한 Bayes Theorem 값을 구하기 -> P(S| L∩W) = 0.96

27_bayes_spam.jpg|800

정보를 1가지를 이용해서 Bayes Theorem 계산한 경우
P(S|L) = 0.75
P(S|W) = 0.89

정보를 2가지를 이용하여 Bayes Theorem 계산한 경우
P(S| L∩W) = 0.96

정보를 결합할 수록 더 정확도가 올라감

반응형