다중 레이블 분류 개요 : 분류기가 샘플마다 여러 개의 클래스(답)를 출력해야 할 때가 있다. 예를 들어 얼굴 인식 분류기를 생각해보면 한 사진에 여러 사람이 있을…
가정 : 이 절에서는 가능성이 높은 모델을 찾았다고 가정하고 이 모델의 성능을 향상시킬 방법을 찾아보는 것이다. 에러분석 모델의 성능을 향상시키는 한 가지 방법으로 만들어진…
다중분류 ( Multiclass classification ) 개요 다중 분류기(multiclass classifier) 는 둘이상의 클래스를 구별하는 방법이다. 여러개의 클래스를 직접 처리할 수 있는 알고리즘 ( 랜덤포레스트, 나이브베이즈등) 이진…
supervised learning 에서 discrete한 성질을 다룰 때 쓰는 방법이다. MNIST dataset 을 이용한다. MNIST sklearn 에서 읽어들인 dataset들은 일반적으로 비슷한 dictionary 구조를 가지고 있다.…
모델 선택과 훈련 모델은 linear regression을 선택했고 5개의 데이터를 학습해서 정답 레이블과 비교해봤다.
|
1 2 3 4 5 6 7 8 9 |
#모델 선택과 훈련 lin_reg = LinearRegression() lin_reg.fit(housing_prepared, housing_labels) some_data = housing.iloc[:5] some_labels = housing_labels.iloc[:5] some_data_prepared = full_pipeline.transform(some_data) print("예측 :",np.round(lin_reg.predict(some_data_prepared))) print("레이블 :",list(some_labels)) |
아주 정확한 예측은 아니지만 작동은한다. 사이킷런의 mean_square_error 함수를 사용해 전체 훈련…
1. 머신러닝 알고리즘을 위한 데이터 준비 머신러닝 알고리즘을 위해 데이터를 준비할 차례인데 이 작업을 함수로 만들어 자동화한다. (향후 편리함을 위하여) 먼저 원래 훈련세트로 복원(strat_train_set 다시한번…
이전 내용 : 캘리포니아 주택 가격 dataset을 사용하여 캘리포니아의 주택 가격 모델을 만드는 연구를 진행하는 상황을 가정했다. 간단한 데이터의 구조를 살펴보았고, 계층적 샘플링과 무작위 샘플링에…
개요 :이 장에서는 부동산 회사에 막 고용된 데이터 과학자라고 가정하고 예제 프로젝트의 처음부터 끝까지 진행하는 것이다. 실제 1990년 캘리포니아 인구조사 데이터를 기반으로 하여 캘리포니아 주택…
youtube : AAILab Kaist 를 base로 공부한 내용 입니다. 설명전 낯설었던 개념의 정의: bayes theorem에서 중요한 점은 다음과 같다. 두 가지 관점 : MLE(Maximum…