배달 데이터 프로젝트 Modeling
지난 포스팅까지 모델링을 위한 모든 전처리 과정을 맞췄다. 이번 포스팅에서는 여러가지 모델을 사용한 모델링의 과정과 성능에 대해 정리해보자.
지난 포스팅까지 모델링을 위한 모든 전처리 과정을 맞췄다. 이번 포스팅에서는 여러가지 모델을 사용한 모델링의 과정과 성능에 대해 정리해보자.
데이터의 변수를 늘려서 모델의 성능을 올리기 위해 여러 변수들을 추가해보자. 날씨, 요일, 공휴일, 축구, 구별 연령대별 인구수, 미세먼지 등의 변수를 추가했다.
KT 빅데이터 플랫폼에서 제공하는 배달 데이터를 활용하여 서울 특별시의 시간대별, 구별로 주문의 정도(많음, 보통, 적음)를 예측하는 모델을 개발했다. 이번 포스팅에서는 어떤 데이터를 추가로 활용하여 모델을 만들고, 성능을 높였는지 코드를 정리해보자.
GAN은 딥페이크의 기반이 되는 신경망 모델이다. 딥페이크가 악용되어서 발생하는 사회적인 문제들이 아주 많지만, 딥페이크는 원래 인공지능이 질병을 잘 학습하고 정확히 진단할 수 있도록 의료용 이미지를 만드는 등의 좋은 목적을 가지고 등장했다. 사생활 문제로 실제 환자의 질병 데이터...
AutoEncoder는 입력된 데이터를 저차원의 벡터로 압축시키고 다시 원본 크기의 데이터로 복원하는 신경망으로, 유용하게 쓰일 수 있다. 이 AutoEncoder를 활용하면 차원을 축소할 수 있고, 데이터의 어느 정도 형태는 유지하면서 데이터를 압축시킬 수 있기 때문에 저장면에서...