Ridge regression

Ridge regression의 성질에 대해 좀 더 깊게 수학적으로 들여다보자.

 

일반 식과 Ridge regression 식의 기대치와 분산의 차이:

 

임의의 linear independent인 행렬 A를 기존 식  를 구한 것과 Ridge 규제 파라미터항 를 각각 1,000과 100,000 으로 두었을 때  를 구한 것이다. 이를 보면서 알 수 있듯이 값이 variance에 영향을 미치는데 점점 커질수록 variance를 더욱 줄이는 효과가 있다.

 

좀더 깔끔한 식으로 정리해본 결과 :

 

  1. Ridge E(β^) 가 biased인데 얼마나 떨어져있는지 계산할 수 있을까?
  2. D(data의 분산정도를 나타내는 diagonal 행렬)을 control 할 수 있는 를 구하려면 휴리스틱하게 접근해야 하는가 ?
  3. 변형된 notation의 가운데 term인  을 (추정식 y를 independent하다 가정을 하는 것인가?)  잘 사용하여서 biased된 것과 를 구해볼 수 있지 않을까?

 

 

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다