DecisionTreeClassifier 예제

06 July 2020

sklearn.datasets의 dataSet을 이용하여, DecisionTreeClassifier로 data를 예측하는 예제를 만들어보도록 하겠습니다.

- init.py

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_wine
from sklearn.metrics import accuracy_score

#load_wine()으로 wine data를 받아오도록 합니다.
wine_data = load_wine()

#train_test_split를 통해 Data를 traing용과 test용으로 나누어줍니다.
#명시하지 않은 경우, 기본 비율은 0.75:0.25 입니다.
X_train, X_test, y_train, y_test = train_test_split(wine_data.data, wine_data.target, random_state=1)

#DecisionTreeClassifier를 만들어줍니다.
classifier = DecisionTreeClassifier(random_state=1)

#training data로 classifier를 훈련시켜줍니다.
classifier.fit(X_train, y_train)

#훈련된 모델로 X_test의 값을 넣었을 때의 결과 값을 받아옵니다.
predict = classifier.predict(X_test)

#accuracy_score로 실제값과 예상값이 얼마나 매칭되는지 확인할 수 있습니다.
print('accuracy score {}'.format(accuracy_score(predict, y_test)))

해당 코드를 실행하면 정상적으로 아래와 같이 출력되는 것을 확인할 수 있습니다.

accuracy score 0.9555555555555556