추천시스템

데이터사이언스/추천시스템

기존 평가의 문제점

"연관된"이라는 의미가 모든 사용자와 아이템들에 대해 정의하기가 쉽지 않다는 것이다. 예를 들어 연관된 아이템을 과거에 구매한 아이템이라고 한다면, 결국 사용자가 과거에 구매한 아이템을 잘 예측한 모델이 높은 점수를 받게 되는 것이다.
위의 메트릭들은 Ranking을 고려하지 않는다. 많은 추천/검색 시나리오에는 상위에 랭크된 아이템/문서에 관심을 가지게 된다.

따라서 이 필요를 맞추고자 Precision@N 혹은 Recall@N을 소개하게 된다.

추천된 상위 K개의 아이템들 중 연관된 아이템이 몇개인가?

결과적으로 Precision@K과 Recall@K은 같은 메트릭이다.

이 메트릭은 많은 경우, 여러번의 실험 중 K개의 아이템 중 사용자가 선택한 아이템이 있다면 1 아니면 0으로 계산해

총 평가 횟수 중 맞춘 갯수의 Percentage를 구하는 방법으로 대체한다.

예를 들어 10번의 실험 중 사용자가 선택한 아이템이 추천시스템이 예측한 아이템의 상위K개에 속한 경우가 3번 있다면

P@K는 0.3이 되는 것이다. 이는 결국 Online 실험에서의 CTR(Click Through Rate)과 같은 메트릭이다.

Click Through Rate이란 보통 광고에서 광고의 노출수 분의 광고의 클릭수를 의미한다.

참고: (후에 소게될 Average Precision때문에 대개는 P@K보다는 R@K을 많이 사용하는 듯 하다.)

대개 세션 기반 추천 (Session Based Recommendation) 논문들에서는 이 지표를 많이 사용한다.

하지만 특정 추천 논문들에서는 저자들이 각자 연관있는 아이템들을 따로 정의해 P@K나 R@K를 구하곤 한다.

728x90