의사결정나무
-
의사결정나무Engineering WIKI/Data Science 2021. 1. 19. 05:59
의사결정나무 개요 의사결정나무는 데이터셋을 반복적으로 분할하는 과정을 통해 생성 데이터셋을 서브셋으로 분할하는 작업을 반복하여 서브셋 내의 데이터가 충분히 서로 동질적일 때까지 분할작업을 반복 의사결정나무는 분할과정을 나타낸 의사결정규칙을 나뭇가지 모양으로 도식화하며, 의사결정나무의 각 가지의 끝(즉 잎)은 분류판정을 나타냄 나무의 구조는 선택되는 가지에 따라 결정되는 결과 또는 귀속범주를 보여주며, 따라서 이러한 의사결정나무의 가지 구조를 바탕으로 새로운 케이스에 대한 분류(분류나무)와 예측(회귀나무)을 수행 의사결정나무분석 절차 데이터를 두 개의 집단으로 가장 잘 분할하는 예측변수와 분할점을 선택 이때 두 집단의 동질성 또는 순도가 최대화되도록 하는 예측변수와 분할점을 선정 예측변수와 분할점을 이용하..