피파온라인 댓글 감성분석 프로젝트 추천시스템 및 결론
지난 포스팅까지 데이터 수집, 전처리, 모델링의 과정을 모두 마쳤다. 이번 포스팅에서는 전처리가 완료된 데이터를 기반으로 사용자가 특정 선수를 입력하면 그 선수와 비슷한 유형의 선수나 관련 있는 선수를 추천해주는 추천시스템의 개발 과정을 정리해보자. 또한, 프로젝트의 분석 결과와 ...
지난 포스팅까지 데이터 수집, 전처리, 모델링의 과정을 모두 마쳤다. 이번 포스팅에서는 전처리가 완료된 데이터를 기반으로 사용자가 특정 선수를 입력하면 그 선수와 비슷한 유형의 선수나 관련 있는 선수를 추천해주는 추천시스템의 개발 과정을 정리해보자. 또한, 프로젝트의 분석 결과와 ...
모델링을 진행하기전에 각 댓글을 형태소 기반으로 토큰화하고 불필요한 특수문자나 불용어들을 제거할 것이다. 모델이 단어를 이해할 수 있게끔 각 단어를 정수로 맵핑해주는 정수 인코딩과 모든 댓글의 길이를 동등하게 맞춰주는 패딩의 과정을 거쳐 모델링을 진행했다. 초기 모델링 후에는 성능...
피파 인벤 홈페이지에서 수집한 댓글 데이터에는 이미 평점 데이터가 주어져서 이 평점 데이터를 기반으로 해당 댓글이 긍정인지 부정인지를 판단할 수 있다. 하지만, 사용자마다 매기는 평점은 주관적이기 때문에 같은 4점의 평점이라도 이 4점이 높은 편인지, 낮은 편인지를 파악하기가 힘들...
댓글과 같은 텍스트 데이터를 처리하는 즉, 자연어를 처리하는 NLP는 실생활에서 매우 유용하게 사용될 수 있다. 이번 프로젝트에서는 평소에 즐겨하던 게임이었던 피파온라인4의 선수 댓글을 감성 분석하고 사용자가 선택한 선수와 비슷한 선수를 추천하는 추천 시스템을 개발했다.
전처리, 모델링의 과정을 모두 거쳐서 최종적으로 정확도 73%, AUC가 0.8723인 모델을 만들었다. 배달 데이터 프로젝트의 마지막 파트에서는 분석 결과와 한계에 대해서 정리해보자.