추천시스템 15 - 단항의 아이템 추천

아카이브/추천시스템(2019)

추천시스템 15 - 단항의 아이템 추천

_금융덕후_ 2019. 7. 7. 22:40

728x90

추천시스템

본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.

https://www.coursera.org/learn/collaborative-filtering?specialization=recommender-systems

단항의 아이템 데이터

단항의 아이템 데이터는 곧 간접적 선호도 정보를 말한다.

아이템의 클릭 수
음악의 플레이 수
구매 이력 등

이런 데이터를 사용하려면 조금의 조정이 필요하다.

다른말로 표현하면, 위와같은 데이터를 평점과 같이 수치화 할 수 있어야 한다.

0/1의 값으로 구매했는지 안했는지 사용
몇번 구매/플레이를 했는지

정보의 수치화

그렇다면 이 정보를 어떻게 수치화하고 정규화할 수 있을까?

평균중심화는 별로 의미가 없다.
벡터값을 단위벡터로 정규화 하면, 많은 아이템을 좋아하는 사용자는 특성이 별로 없다는 정보를 반영하게 된다.

유사도

값들을 정규화 했다면 어떻게 유사도를 구할 수 있을까?

코사인 유사도도 좋은 방법이다. w_{ij} = cos(\hat{\bar{r}}_i, \hat{\bar{r}}_j)
조건부 확률을 사용한다. - 연관규칙과 비슷해진다. w_{ij} = P(r_i | r_j)

합계 구하기

가중치가 적용된 합계는 의미가 없다.
0/1의 값은 결국 이웃들의 유사도를 더하면 된다.

$$S(I;u) = \sum_{j \in N} w_{ij}$$

728x90

'아카이브 > 추천시스템(2019)' 카테고리의 다른 글

추천시스템 17 - 행렬 분해 (0)	2019.07.30
추천시스템 16 - 사용자-사용자 협업필터링 코드예제 (0)	2019.07.07
추천시스템 14 - 아이템-아이템 협업필터링 (0)	2019.07.07
추천시스템 13 - 사용자-사용자 협업필터링 (0)	2019.07.01
추천시스템 12 - 컨텐츠기반 추천 코드예제 (0)	2019.07.01

현재글추천시스템 15 - 단항의 아이템 추천

댓글

티스토리툴바