들어가기 앞서 위키피디아 처럼 전문가의 답보다 수 만명의 사람들이 의견을 모아 내놓은 답이 더 낫다. 이를 대중의 지혜라고 한다. 이와 비슷하게 일련의 예측기로부터 예측을 수집하면…
Decision Tree 이 장에서는 결정 트리의 훈련, 시각화, 예측 방법에 대해 먼저 살펴본다. 그 후 사이킷런의 CART 훈련 알고리즘을 둘러보고 트리에 규제를 가하는 방법과 회귀…
Support Vector Machine 이번 part에선 신경망이 활황을 이루기전 가장 강력한 머신러닝 모델로써 그 원리와 사용방법에 대해 공부하고자 한다. Support Vector Machine 이론 :…
의 결과로 SVM에서 기하적인 의미에서 두 초평면 사이의 거리 즉 , margine를 구하면 라는 것을 알 수 있다. ( 궁금증 해결 )
정보이론에서 entropy가 어떻게 정의되어 있으며 개념과 머신러닝으로 어떻게 접목이 되는지 중심으로 설명. cross entropy cost function으로의 유도 과정 등
Logistic Regression 선형 회귀를 연속적인 것에서 이산적인 것으로 변환하여 분류기처럼 행동하게끔 할수 있게 해주는 방법이다. 주어진 데이터들이 이산적이거나 (성별 0 또는 1) , 연속적인 (키…
Logistic Regression에 대해서 공부하던 중 수식 유도 후, 모형의 적합성 검정 및 회귀계수 유의성 검정에 대한 부분에서 AIC를 사용하는 이유에 대해 궁금해 공부해봤다. 좀더 공부가…
규제가 있는 선형모델 개요: 모델의 과대적합을 감소시키는 좋은 방법은 모델을 규제하는 것이다. 다항회귀의 모델에서는 다항식의 차수를 감소시키는 것이고 선형회귀 모델에서는 보통 모델의 가중치를 제한함으로써 규제를…
Gradient Descent와 직접적으로 관계가 있는 건 아니고 평소에 궁금하던거라 공부해봄
Gradient Descent를 설명할 때 필요한 부분은 임계점 개념정도인 것 같은데 이왕 공부한 김에