train_test_split ??

train 이 모의고사

분류는 말그대로 분류 (사진, 범용)

회귀는 내일 어떻게 될까?(돈, 수치)

앙상블 기법?

오차 행렬?

이 과정에서 엔트로피, 정보량, 지니불순도 등의 정보이론 개념이 포함됩니다. 이러한 내용은 오늘 실습에서 모두 자세히 다루지는 않을 것이지만, 머신러닝 모델의 알고리즘을 이해하기 위해서는 이러한 배경에 대한 공부가 필수적입니다. 다행히 기본 개념에 대한 좋은 설명자료들이 구글에 넘치도록 많으니, 꼭 한 번 보다 깊은 내용에 대해 학습하는 것을 추천합

scikit-learn Toy datasets 활용

https://scikit-learn.org/stable/datasets.html

Decision Tree 모델?

Random Forest

먼저, Decision Tree를 여러개 모아놓은 Random Forest

Random Forest는 Decision Tree모델을 여러개 합쳐 놓음 으로써 Decision Tree의 단점을 극복한 모델 이러한 기법을 앙상블(Ensemble)기법 단일 모델을 여러 개 사용하는 방법을 취함으로써 모델 한 개 만 사용할 때의 단점을 집단지성으로 극복하는 개념