본문 바로가기
딥러닝(deep learning)/인공신경망(Neural Network)

데이터 분포가 치우쳐 있다면

by 바코94 2019. 7. 26.

wine 데이터는 정답데이터가 1이 거의 없고 0이 대부분이다. 따라서 트레이닝 데이터와 테스트 데이터 분리시 1,0을 각각 나눠서 적정 비율로 트레이닝과 테스트로 나눠주는 작업을 해야한다.

 

하지만 0의 비율이 워낙 많기 때문에 좋은 데이터는 아니다. 예측값이 0이 되도록 W, b값들을 변경시키게

된다.

 

 

wine.csv
0.35MB