728x90
반응형

Recommender system 4

추천시스템 - (11) 추천시스템 평가

추천시스템 추천시스템의 평가 추천시스템의 평가는 추천을 하기 위해 만들어진 모델이 얼마나 좋은 성능을 보이는가를 평가한다. 추천 모델을 평가할때는 하나의 값을 얼마나 잘 맞추었는지에 중점을 두지 않는다. 이는 추천이 결국 사용자가 좋아하는 아이템을 선정하려는 결정에 도움을 주려는 목적을 가지고 있기 때문이다. 따라서 얼마나 잘 맞추었는지 보다는 추천된 아이템 중 어떤 아이템이 좋은 아이템이고 어떤 아이템이 나쁜 아이템인지에 중점을 둔다. 일반적으로 머신러닝 문제에서는 에러율을 기준으로 모델이 좋은지 혹은 나쁜지 평가한다. 하지만 추천에서는 (검색 분야에서 파생 되었기 때문에 같은 메트릭을 사용한다) Precision과 Recall을 더 주로 사용한다. Precision 선택된 아이템들 중 몇개의 아이템이..

추천시스템 - (10) 추천시스템의 학습

추천시스템 추천시스템의 학습 데이터 추천시스템은 보통 이미 존재하는 사용자들의 기록들을 통해 학습된다. 이 기록들은 보통 사용자들의 구매 이력, 평점 이력, 클릭 이력 등의 로그성 데이터이다. 추천 모델은 이 사용자들의 기록을 학습함으로서 시뮬레이션 하게 된다. 학습된 시뮬레이션을 통해 사용자의 다음 행동을 예측할 수 있는지를 테스트 하는 것이 추천 모델을 평가하는 것이 된다. Train Test Split 대개의 머신러닝 문제와 같이, 추천 시스템의 평가는 학습 데이터와 테스트 데이터를 분리하게 된다. 만약 존재하는 데이터로 추천 모델을 학습시킨 뒤, 이를 실제 서비스 중인 웹사이트에 적용해 테스트 한다면, 이런 테스트 방법을 Online 평가라고 부른다. 하지만, 많은 경우 여건상, 이런 Online..

추천시스템 - (8) 연관성 분석 추천 예제

추천시스템 다음은 분석에 사용될 파일입니다. 연관성 분석 예제¶ 다음 예제는 연관성 분석을 통해 20명의 사용자들에게 20개의 영화를 추천하는 예제입니다. 패키지 임포트¶ 패키지는 pandas 패키지를 사용하였습니다. pandas의 버전은 다음과 같습니다. In [1]: import pandas as pd pd.__version__ Out[1]: '0.25.1' 영화 데이터¶ 다음은 분석에 사용할 영화 데이터 입니다. In [2]: movies_df = pd.read_csv('./np-ratings.csv') print(movies_df.shape) movies_df.head() (20, 20) Out[2]: 260: Star Wars: Episode IV - A New Hope (1977) 1210: ..

추천시스템 - (2) 선호도

추천시스템 서론 비개인적추천이란 사용자의 선호도가 고려되지 않은 추천이다. 이번에는 개인적추천과 비개인적추천 모두에 사용되는 데이터가 어떻게 발생되고 모아지는지에 대해서 이야기 한다. 추천을 하기 위해서는, 사용자가 어떤것을 좋아하는지에 대한 데이터와 어떤것들이 연관성이 있는지에 대한 데이터가 필요하다. 많은 시스템들에서 이러한 데이터들은 어떠한 방식으로든 사용자에게서 모은다. 어떤 데이터가 모아지는지, 그 데이터들이 어떤 의미인지에 대해서 알아보려 한다. 선호도 모델 선호도는, 사용자가 액션 영화를 좋아하는지, 또는 어떤 물건들이 연관성이 있는지와 같은 방대한 범위의 데이터이다. 사용자들은 선호도를 나타내기 위해 어떤 행위를 하는가? 사용자들은 선호도를 나타내기 위해서 명시적으로 평점을 매기거나 물건을..

728x90
반응형