본문 바로가기
딥러닝(deep learning)/인공신경망(Neural Network)

머신러닝 이용 중 발생하는 빅데이터 처리

by 바코94 2019. 7. 26.

비정형 데이터가 바로 빅데이터이다. 즉, 테이블 형태로 구성하지 않고 정형화되지 않은 데이터이다.

 

이를 관리하는 시스템이 하둡과 스파크 등이 있으며 추후 학습할 예정.

 

참고로 하둡개발자 신입 연봉이 개발자 중에서 최상위권이다.

 

머신러닝에서 트레이닝데이터, 테스트데이터 분리한 것을 저장하고 학습 결과를 저장할 때 사용하게 된다.

 

uci machine learning repository 링크. 데이터가 많으나 친절하지 않다.

https://archive.ics.uci.edu/ml/datasets.php