Part 1 CLASSIFICATION
1. Machine learning basics
Numpy, matrix, array etc
2. Classifying with k-Nearest Neighbors
숫자 인식.. 스킵.
3. Splitting datasets one feature at a time : decision trees
스무고개 ? 예/아니오 만 가능.
가장 보편적인 등급화 기법. 조사 결과 가장 많이 사용되는 ‘기법’.
이메일 분류.. 직원, 하키(친구) 기타는 스팸으로 분류.
콘택 렌즈 분류..
3.1 Tree construction
D. trees
Pro : 싸다, 결과를 사람이 인지하기 쉽다. 값이 빠져도 OK, 상관없는 특성들을 다룰 수 있다.
Cons : Prone to overfitting
숫자 값, niminal values 에 사용.
Information theory ..
데이터를 나눌 첫번째 결정을 설정해야..
createBranch .. 재귀적..
어떻게 데이터셋을 나눌 것인가. [10/27]
General approach to decision trees
1. Collect : Any method.
2. Prepare : ~~~