본문 바로가기

전체 글621

의사결정나무 의사결정나무 개요 의사결정나무는 데이터셋을 반복적으로 분할하는 과정을 통해 생성 데이터셋을 서브셋으로 분할하는 작업을 반복하여 서브셋 내의 데이터가 충분히 서로 동질적일 때까지 분할작업을 반복 의사결정나무는 분할과정을 나타낸 의사결정규칙을 나뭇가지 모양으로 도식화하며, 의사결정나무의 각 가지의 끝(즉 잎)은 분류판정을 나타냄 나무의 구조는 선택되는 가지에 따라 결정되는 결과 또는 귀속범주를 보여주며, 따라서 이러한 의사결정나무의 가지 구조를 바탕으로 새로운 케이스에 대한 분류(분류나무)와 예측(회귀나무)을 수행 의사결정나무분석 절차 데이터를 두 개의 집단으로 가장 잘 분할하는 예측변수와 분할점을 선택 이때 두 집단의 동질성 또는 순도가 최대화되도록 하는 예측변수와 분할점을 선정 예측변수와 분할점을 이용하.. 2021. 1. 19.
나이브베이즈 나이브베이즈 분석 예측변수의 값 : 사전에 알고 있는 정보 어떤 사건이 발생할 조건부 확률 : 예측변수의 값이 주어졌을 때 우리가 관심을 갖는 특정 범주가 발생할 확률 각 케이스별로 사건발생의 예측확률이 계산되면 이 값을 사전에 설정한 임계값과 비교하여 그보다 크면 사건 발생으로, 그렇지 않으면 사건 미발생으로 분류 예를 들면, 임계값을 0.5로 했을 때 도출된 예측확률이 0.5보다 크면 사건이 발생하고 0.5보다 작으면 사건이 발생하지 않는 것으로 예측 나이브베이즈는 예측변수 가운데 하나라도 0의 확률을 가지고 있으면 전체의 조건부 확률이 0이 된다. 해결책 : 라플라스 추정치를 이용하여 해결 라플라스 추정치 : 훈련 데이터의 각 빈도값에 작은 값을 더한다. 라플라스 추정치는 1로 설정되며, 이는 모든.. 2021. 1. 19.
[2021 읽은 책 ] 죽은 자의 집청소 - 김완 - 교훈적인 내용은 못느끼고 저자의 고생함을 느낌 (⭐️⭐️) 2021. 1. 18.
[2021 읽은 책 ] 내가 죽으면 장례식에 누가 와줄까 - 김상현 - 읽은 지 한달이 되었지만 기억이 나지 않음,, 근데 왜 읽고나서 별3개 줬지,,, (⭐️⭐️⭐️) 2021. 1. 18.
[2021 읽은 책 ] 일의 기본 생활의 기본 100 - 마쓰우라 야타로 - 초심을 생각나게 해주는 책 (⭐️⭐️⭐️⭐️⭐️) 2021. 1. 18.
[Window] 윈도우 환경변수와 시스템 변수 사용자변수 : 컴퓨터에 있는 각 계정에서 사용하는 변수, 해당 사용자의 계정으로 컴퓨터에 로그인 시에만 적용되는 변수 시스템변수 : 시스템 전반에 걸쳐 적용되는 변수, 즉 전역변수와 같은 개념 2021. 1. 17.