[ML] Classification Algorithms –Decision Trees
Decision Tree 1. Gini index 노드 t의 gini index를 구하는 공식은 아래와 같다. 데이터가 모든 클래스에 균등하게 분포되어 있는 경우가 Gini index의 최대값을 갖는다. 그 최대값은 (1 - 1/nc)이다. 모든 데이터가 하나의 클래스에 속할 때는 Gini index의 최소값인 (0.0)을 갖는다. 아래 표에서 가장 왼쪽에 있는 경우가 Gini index의 최소값을 가지고 있고, 가장 오른쪽에 있는 경우가 Gini index의 최대값을 가지고 있다. 왼쪽부터 차례대로 Gini index를 구하는 과정은 다음과 같다. P(C1) = 0/6 = 0 P(C2) = 6/6 = 1 Gini=1–P(C1)^2–P(C2)^2 =1–0–1=0 P(C1) = 1/6 P(C2) = 5/6..
machine learning
2022. 12. 12. 12:29