728x90
반응형
추천시스템
본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.
https://www.coursera.org/learn/collaborative-filtering?specialization=recommender-systems
단항의 아이템 데이터
단항의 아이템 데이터는 곧 간접적 선호도 정보를 말한다.
- 아이템의 클릭 수
- 음악의 플레이 수
- 구매 이력 등
이런 데이터를 사용하려면 조금의 조정이 필요하다.
다른말로 표현하면, 위와같은 데이터를 평점과 같이 수치화 할 수 있어야 한다.
- 0/1의 값으로 구매했는지 안했는지 사용
- 몇번 구매/플레이를 했는지
정보의 수치화
그렇다면 이 정보를 어떻게 수치화하고 정규화할 수 있을까?
- 평균중심화는 별로 의미가 없다.
- 벡터값을 단위벡터로 정규화 하면, 많은 아이템을 좋아하는 사용자는 특성이 별로 없다는 정보를 반영하게 된다.
유사도
값들을 정규화 했다면 어떻게 유사도를 구할 수 있을까?
- 코사인 유사도도 좋은 방법이다. w_{ij} = cos(\hat{\bar{r}}_i, \hat{\bar{r}}_j)
- 조건부 확률을 사용한다. - 연관규칙과 비슷해진다. w_{ij} = P(r_i | r_j)
합계 구하기
- 가중치가 적용된 합계는 의미가 없다.
- 0/1의 값은 결국 이웃들의 유사도를 더하면 된다.
$$S(I;u) = \sum_{j \in N} w_{ij}$$
728x90
반응형
'아카이브 > 추천시스템(2019)' 카테고리의 다른 글
추천시스템 17 - 행렬 분해 (0) | 2019.07.30 |
---|---|
추천시스템 16 - 사용자-사용자 협업필터링 코드예제 (0) | 2019.07.07 |
추천시스템 14 - 아이템-아이템 협업필터링 (0) | 2019.07.07 |
추천시스템 13 - 사용자-사용자 협업필터링 (0) | 2019.07.01 |
추천시스템 12 - 컨텐츠기반 추천 코드예제 (0) | 2019.07.01 |