아카이브/추천시스템(2019)

추천시스템 15 - 단항의 아이템 추천

_금융덕후_ 2019. 7. 7. 22:40
728x90
반응형

추천시스템

본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.

https://www.coursera.org/learn/collaborative-filtering?specialization=recommender-systems

단항의 아이템 데이터

단항의 아이템 데이터는 간접적 선호도 정보를 말한다.

  • 아이템의 클릭
  • 음악의 플레이
  • 구매 이력

이런 데이터를 사용하려면 조금의 조정이 필요하다.

 

다른말로 표현하면, 위와같은 데이터를 평점과 같이 수치화 있어야 한다.

  • 0/1 값으로 구매했는지 안했는지 사용
  • 몇번 구매/플레이를 했는지

 

 

정보의 수치화

그렇다면 정보를 어떻게 수치화하고 정규화할 있을까?

  • 평균중심화는 별로 의미가 없다.
  • 벡터값을 단위벡터 정규화 하면, 많은 아이템을 좋아하는 사용자는 특성이 별로 없다는 정보를 반영하게 된다.

 

유사도

값들을 정규화 했다면 어떻게 유사도를 구할 있을까?

  • 코사인 유사도도 좋은 방법이다. w_{ij} = cos(\hat{\bar{r}}_i, \hat{\bar{r}}_j)
  • 조건부 확률을 사용한다. - 연관규칙과 비슷해진다. w_{ij} = P(r_i | r_j)

 

합계 구하기

  • 가중치가 적용된 합계는 의미가 없다.
  • 0/1 값은 결국 이웃들의 유사도를 더하면 된다.

$$S(I;u) = \sum_{j \in N} w_{ij}$$

 

 

 

 

728x90
반응형