Note 331 Docker
도커(Docker, 개발환경 중 하나)는 애플리케이션 실행 환경을 코드로 작성할 수 있고, OS를 격리화하여 관리하는 기술이다. 리눅스에서 돌아가는 프로그램을 사용자의 PC에서도 쉽고(docker file을 통해) 빠르게(Container를 통해) 동작할 수 있도록 툴을 제공한다.
도커(Docker, 개발환경 중 하나)는 애플리케이션 실행 환경을 코드로 작성할 수 있고, OS를 격리화하여 관리하는 기술이다. 리눅스에서 돌아가는 프로그램을 사용자의 PC에서도 쉽고(docker file을 통해) 빠르게(Container를 통해) 동작할 수 있도록 툴을 제공한다.
모든 전처리가 끝나고 모델링 파트까지 왔다. 모델링은 Part1,2로 나누어져있고, 모델링은 모두 R을 사용했다. Part.1에서는 가벼운 모델인 OLS와 단위 시간당 특정 사건의 갯수를 예측하는 포아송 회귀 모델을 사용했다.
전처리 Part.7 에서는 다시 한번 국지적 모란지수를 활용해서 연령과 사고유형별로 의미가 떨어지는 사고격자를 제거하고, 사망자수, 중상자 수에 따라 가중치를 도출했다. 이 가중치가 높을 수록 교통사고에 더 치명적인 격자가 될 것이라고 가정했다.
R을 사용하여 교통사고내역 데이터의 사고유형, 연령대 변수를 현재까지 구축한 데이터와 병합한다. 그 후, python으로 사망자, 중상자 ,경상자 수를 gid 격자별로 count하고 병합한다.
SQL은 관계형 데이터베이스로 관계와 구조가 정해져 있기 때문에 스키마를 짜고, 데이터를 입력하는 데에 많은 시간이 소요된다. 하지만, 이미 짜여진 스키마를 토대로 데이터를 읽어오기만 하면 되어서 데이터를 읽어온 후에는 데이터가 어느 정도 정제가 되어 있을 것이다. 데이터베이스는 ...