Mnist 와 XOR 데이터의 비선형성 추측

예전에 Mnist 데이터를 CNN 으로 돌릴 때, CNN 과 DNN 쪽 모두에 활성화 함수를 빼고 max pooling 만 진행한 결과 accuracy 가 90초반대로 높게 나왔던 것을 알 수 있었다. 그래서 문득 혹시 비선형성을 다 제외하면 어떻게 될까라는 의문에 코드를 돌렸다. 추측 결과는 분류에 대한 문제는 마지막 항에 softmax 를 사용하기 때문에 이 부분에서 비선형성을 가지게 되고 XOR 문제는 이 비선형 모듈만으로는 문제를 풀지 못했고 Mnist는 softmax 비선형 모듈만 사용했는데도 90 초반의 정확성을 보였다. 데이터의 비선형성이 case by case 라고 짐작해본다.

 


1. CNN ( 합성곱 필터 (10,1,3,3), DNN 히든 노드 200 , 출력 노드 10 softmax , cross-entropy) 모델 (활성화 함수 사용 x)

 

 

2. DNN (784 200 10 softmax cross-entropy) 모델 , 활성화함수 사용 x

 

3. XOR 데이터 (입력2 히든레이어1의 노드 2개, 출력 2) 원핫벡터 softmax crossentropy 활성화 함수 x

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다