데이터사이언즈 나이브베이즈1 나이브베이즈 나이브베이즈 분석 예측변수의 값 : 사전에 알고 있는 정보 어떤 사건이 발생할 조건부 확률 : 예측변수의 값이 주어졌을 때 우리가 관심을 갖는 특정 범주가 발생할 확률 각 케이스별로 사건발생의 예측확률이 계산되면 이 값을 사전에 설정한 임계값과 비교하여 그보다 크면 사건 발생으로, 그렇지 않으면 사건 미발생으로 분류 예를 들면, 임계값을 0.5로 했을 때 도출된 예측확률이 0.5보다 크면 사건이 발생하고 0.5보다 작으면 사건이 발생하지 않는 것으로 예측 나이브베이즈는 예측변수 가운데 하나라도 0의 확률을 가지고 있으면 전체의 조건부 확률이 0이 된다. 해결책 : 라플라스 추정치를 이용하여 해결 라플라스 추정치 : 훈련 데이터의 각 빈도값에 작은 값을 더한다. 라플라스 추정치는 1로 설정되며, 이는 모든.. 2021. 1. 19. 이전 1 다음