배달 데이터 프로젝트 전처리 및 EDA Part.1
KT 빅데이터 플랫폼에서 제공하는 배달 데이터를 활용하여 서울 특별시의 시간대별, 구별로 주문의 정도(많음, 보통, 적음)를 예측하는 모델을 개발했다. 이번 포스팅에서는 어떤 데이터를 추가로 활용하여 모델을 만들고, 성능을 높였는지 코드를 정리해보자.
KT 빅데이터 플랫폼에서 제공하는 배달 데이터를 활용하여 서울 특별시의 시간대별, 구별로 주문의 정도(많음, 보통, 적음)를 예측하는 모델을 개발했다. 이번 포스팅에서는 어떤 데이터를 추가로 활용하여 모델을 만들고, 성능을 높였는지 코드를 정리해보자.
GAN은 딥페이크의 기반이 되는 신경망 모델이다. 딥페이크가 악용되어서 발생하는 사회적인 문제들이 아주 많지만, 딥페이크는 원래 인공지능이 질병을 잘 학습하고 정확히 진단할 수 있도록 의료용 이미지를 만드는 등의 좋은 목적을 가지고 등장했다. 사생활 문제로 실제 환자의 질병 데이터...
AutoEncoder는 입력된 데이터를 저차원의 벡터로 압축시키고 다시 원본 크기의 데이터로 복원하는 신경망으로, 유용하게 쓰일 수 있다. 이 AutoEncoder를 활용하면 차원을 축소할 수 있고, 데이터의 어느 정도 형태는 유지하면서 데이터를 압축시킬 수 있기 때문에 저장면에서...
MLP나 CNN을 이용하면 이미지에 맞는 class를 예측하는 이미지 분류를 할 수 있다. 하지만, MLP는 공간정보를 보존하지 못하고, CNN 또한 완전 연결 신경망 층에서는 기존에 추출했던 공간정보를 보존하지 못하기 때문에 더 세부적인 이미지 분류가 어렵다. 이번 포스팅에서는 ...
이미지 데이터는 공간적인 특성을 가지고 있고 (높이, 너비, 깊이) 라는 3차원 텐서로 표현되는데 여기서 깊이란 이미지가 흑백인지 컬러인지를 구분할 수 있게 한다. 예를 들어 (28,28,1)의 이미지는 가로 세로 벡터의 크기가 28인 이미지이고 깊이(채널)은 1이기 때문에 흑백 ...