2023-10-18 30th Class
여러 클래스 및 현상의 베이즈 정리
Excercise 1. 출생아 성비 (class가 3개인 경우)
#️⃣ 표준 통계학 관점의 데이터
출생아 성비가 아래와 같다고 가정
남아: 여아 = 51:49
- Bayes theorem에서는 특정 부부의 관점에서 추정할 수 있음
#️⃣ 여아 출산 기준의 Class 구분(y)
여아를 더 잘 출산하는 부부 -> P1 = 0.6
여아, 남아가 비슷한 경우 -> P2 = 0.5
남아를 더 잘 출산하는 부부 -> P3 = 0.4
#️⃣ pic
- class는 여아를 더 잘 출산, 여아 남아 비슷, 남아를 더 잘 출산하는 부부 총 3가지 케이스로 각각 1/3 씩의 확률로 세팅 됨
- 1/3 등분이 된 각 면적에서 파란색 부분은 여아를 출산할 확률로 (P=0.6)
- 각 파란색 실면적은 여아를 출산한 경우로 윗변인 1/3 x 좌변인 0.6, 0.5, 0.4를 각각 곱한 6/30(=0.2), 5/30(=0.1666), 4/30(=0.1333)임
- 각 빨간색 실면적은 남아를 출산한 경우로 윗변인 1/3 x 좌변인 0.4, 0.5, 0.6을 각각 곱한 4/30(=0.1333), 5/30(=0.1666), 6/30(=0.2)임
#️⃣ likelihood (class 기준 info의 확률)
- 각 클래스 별로 likelihood를 2개씩 가지고 있음
#️⃣ posterior (info 기준 class의 확률)
Excercise 2. 스팸메일 (info가 2개인 경우)
#️⃣ 표준 통계학 관점의 데이터
스팸메일(SPAM)과 일반메일(HAM)의 비율
Spam : Ham = 0.5 : 0.5
#️⃣ 스팸 메일 기준의 Class 구분(y)
기준1
Link가 있는 메일이 스팸일 경우 = 0.6
Link가 있는 메일이 일반메일일 경우 = 0.2
기준 2
Word가 있는 메일이 스팸일 경우 = 0.4
Word가 있는 메일이 일반메일일 경우 = 0.05
이 경우에
(1) Link 기준으로 Bayes Theorem 값 -> P(S|L) = 0.75
(2) Word 기준으로 Bayes Theorem 값 -> P(S|W) = 0.89
(3) Link와 Word를 모두 고려한 Bayes Theorem 값을 구하기 -> P(S| L∩W) = 0.96
정보를 1가지를 이용해서 Bayes Theorem 계산한 경우
P(S|L) = 0.75
P(S|W) = 0.89
정보를 2가지를 이용하여 Bayes Theorem 계산한 경우
P(S| L∩W) = 0.96
정보를 결합할 수록 더 정확도가 올라감
'Education > 새싹 TIL' 카테고리의 다른 글
새싹 AI데이터엔지니어 핀테커스 7주차 (금) - Bayes Theorem (Gaussian Naive Bayes) (0) | 2023.10.20 |
---|---|
새싹 AI데이터엔지니어 핀테커스 7주차 (목) - Bayes Theorem (Multi Info) (0) | 2023.10.19 |
새싹 AI데이터엔지니어 핀테커스 7주차 (화) - Bayes Theorem 개념 (0) | 2023.10.17 |
새싹 AI데이터엔지니어 핀테커스 7주차 (월) - Decision Tree with Continuous Values (1) | 2023.10.17 |
새싹 AI데이터엔지니어 핀테커스 6주차 (금) - Decision Tree with IGR (0) | 2023.10.14 |