바코94 2019. 8. 5. 14:59

pandas read_csv -> 데이터 프레임을 리턴

데이터 프레임은 시리즈(칼럼) 으로 이루어짐.

read_csv("train.csv").values -> 넘파이로 리턴해줌.

 

1. 칼럼이 결과에 영향을 미치는가

 보면서 파악.

 

2. 문자열 처리

 1,2,3처럼 넘버 부여.

 

3. 공란 처리

 0 같은 어떤 숫자로 놓는 것이 가능하다면 가능.

 

4. 정규화를 어떻게 할 것인가

 

4.1 정규화 테크닉 중 하나

min <= x <= max

min-min <= x -min <= max-min

0 <= (x-min) /( max-min) <= 1