PLS ( Partial Least Squares )
앞전과 같이 iris data 를 사용하는데 , iris data 는 4개의 변수 ( Sepal length, width, Petal length, width ) 들로 이루어져 있고 그에 대응하는 y data ( setosa , versicolor , verginica ) 로 이루어져 있다. 부분최소제곱법 (PLS) 를 구현하기 위해 y data 를 사용하지 않고 대신, Petal width 를 y data로 사용하고 나머지 세 변수들을 X_data 로 사용했다.
PLS 방법은 PCR 과 다르게 Y response 도 고려해서 변수를 추출하는 방법이다. PLS 에선 X, Y 둘을 random variable 로 보고 수행한다. 하지만 X 를 random variable 이라고 가정한 순간 regression 가정이 무너진다.
algorithm

코드 :


PLS 에서 구한 W vector 가 왜 orthogonal 한지는 확인해봐야함.
: 이는 직교분해정리에 의해 설명이 가능