Note 312 Database, SQL, Relations
실무에서는 csv 파일, 엑셀 파일을 쓰는게 아니라 기업 내의 데이터 베이스에서 데이터를 불러와서 사용한다. 이 데이터 베이스에 대한 개념들과 기본 쿼리문에 대해 알아보자.
실무에서는 csv 파일, 엑셀 파일을 쓰는게 아니라 기업 내의 데이터 베이스에서 데이터를 불러와서 사용한다. 이 데이터 베이스에 대한 개념들과 기본 쿼리문에 대해 알아보자.
데이터 직군에는 데이터 과학자, 데이터 분석가, 데이터 엔지니어 등 여러가지가 있다. 지금까지 데이터 분석가에 관련된 공부를 했다면, 이번에는 데이터 엔지니어와 관련된 백엔드 개념, 실전에서 사용되는 기술들을 공부해보자.
선형 회귀에서는 회귀 계수를 통해 변수가 타겟에 영향을 미치는 정도를 파악할 수 있었다. 하지만, 좋은 성능을 내기 위해 단순한 선형 회귀가 아닌 복잡한 모델을 사용하면 모델을 해석하기가 어려워진다. 즉, 어떤 변수가 타겟에 얼만큼 영향을 미치는지 설명하기가 어려워진다는 뜻이다. ...
RandomForest 모델은 기본 모델인 Decision Tree 모델을 각각 독립적으로 학습하여 모든 기본모델의 학습 결과를 반영해서 최종 타겟값을 예측하는 Bagging 모델이다. Bagging 외에도 다양한 앙상블 기법 중 Boosting과 Stacking이 있는데 이번 ...
지난 이틀동안 ML에서 일어날 수 있는 문제들과, Data Wrangling에 대해 배웠다. 또한, 불균형한 데이터를 처리하는 방법에 대해서도 알 수 있었다.