머신러닝 기말고사 대체과제 많이 부족했지만 성적 잘 받은 보고서 !! * pc버전으로 보는걸 권장합니다 주제: 나이브 베이즈 모델을 이용한 확률 기반의 스팸 메일 분류기참고 자료* 나이브 베이즈 개념 및 스팸메일 필터 데이터 구축* 나이브 베이즈 기반 스팸메일 필터 모델 학습 1. 나이브 베이즈 분류기란? - 확률 기반의 분류기 - 데이터가 각 클래스에 속할 특징 확률을 계산 - 나이브:예측한 특징이 상호 독립적이라는 가정 하에 확률 계산을 단순화 - 베이즈:입력 특징이 클래스 전체의 확률 분포 대비 특정 클래스에 속할 확률을 베이즈 정리를 기반으로 계산 2. 이용 데이터 - Enron 이메일 데이터 세트: preprocessed format- 3672개의 정상 메일,1500개의 스팸 메일로 구성- ..