Decision Tree 이 장에서는 결정 트리의 훈련, 시각화, 예측 방법에 대해 먼저 살펴본다. 그 후 사이킷런의 CART 훈련 알고리즘을 둘러보고 트리에 규제를 가하는 방법과 회귀…
Support Vector Machine 이번 part에선 신경망이 활황을 이루기전 가장 강력한 머신러닝 모델로써 그 원리와 사용방법에 대해 공부하고자 한다. Support Vector Machine 이론 :…
Logistic Regression 선형 회귀를 연속적인 것에서 이산적인 것으로 변환하여 분류기처럼 행동하게끔 할수 있게 해주는 방법이다. 주어진 데이터들이 이산적이거나 (성별 0 또는 1) , 연속적인 (키…
규제가 있는 선형모델 개요: 모델의 과대적합을 감소시키는 좋은 방법은 모델을 규제하는 것이다. 다항회귀의 모델에서는 다항식의 차수를 감소시키는 것이고 선형회귀 모델에서는 보통 모델의 가중치를 제한함으로써 규제를…
학습 곡선 개요 : 앞전 식을 300차 다항회귀 모델과 2차, 1차 선형회귀 모델로 학습했을 때의 결과다. 300차 다항회귀 모델은 과대적합되어있고 선형 회귀 모델은 과소적합되어있는 것을…
다항회귀 비선형식 가지고 있는 data가 non-linear한데도 선형 모델처럼 표현할 수 있다. 또한 학습하는 데도 선형 모델을 사용할 수 있다. 이렇게 하는 간단한 방법은 각…
경사 기울기 하강법 개요 : data들의 최적점은 기울기가 0인 곳(하나의 global minimum만 존재할 때)에 있고, 이는 각각의 data들을 정답에 대해 편미분 했을 때 연립방정식으로 0을…
개요 : 이 장에서는 머신러닝 모델과 훈련 알고리즘을 들여다 보는 chapter이다. 이 장의 주요 part는 다음과 같다. 1.Linear Regression 2.Gradient Descent 3.Polynomial Regression 4.Learning Curve…
다중 레이블 분류 개요 : 분류기가 샘플마다 여러 개의 클래스(답)를 출력해야 할 때가 있다. 예를 들어 얼굴 인식 분류기를 생각해보면 한 사진에 여러 사람이 있을…
가정 : 이 절에서는 가능성이 높은 모델을 찾았다고 가정하고 이 모델의 성능을 향상시킬 방법을 찾아보는 것이다. 에러분석 모델의 성능을 향상시키는 한 가지 방법으로 만들어진…