데이터사이언스/추천시스템

추천시스템 - (7) 제품연관성

_금융덕후_ 2020. 6. 26. 21:18
728x90
반응형

추천시스템

아마존과 같은 쇼핑사이트에서 상품을 , 연관성 있는 제품을 추천해 주는것을 있다.

비개인적 추천은 추천을 하기 위한 맥락이 부족하다.
하지만, 연관제품 추천은 이런 상황에서 매우 구체적인 맥락을 만들어준다.
사용자가 현재 보고있는 제품을 맥락으로 보고 관련 제품을 추천할 있기 때문이다.

 

단기적, 맥락적 개인화

이러한 추천은 라이프사이클을 가지지 않는 추천이고, 지금 사용자가 무엇을 하고 있는가에 대한 맥락이 있는 개인화이다.

  • 사용자가 이리저리 이동하는 것을 보고 사용자의 현재의 관심을 파악할 있다
  • 사용자 개인의 선호도에 대한 오래된 시간적인 정보를 반영하지는 않는다.

 

추천 계산법

수작업: 교차판매표

  • 수작업으로 교차판매표를 만들어, 특정 상품과 연관성있는 상품을 추천할 있는 로직을 만든다
  • 예를 들어, TV 사려는 사람이 있다면, TV 관련된 HDMI케이블이나, 전원케이블 등을 추천할 있을것이다.

데이터 마이닝: 연관성 분석

  • 현재 맥락에서 가장 살만한 물건인가?

 

간단한 예제로 시작해보자:

X라는 물건을 이미 사용자가 Y라는 물건을 샀다고 하자. 얼마나 많은 X 사람이 Y 사는가를 계산한다.

$$\frac{X \land Y}{X}$$

이러한 방법이 정말로 효율적인가?

만약 X 멸치이고 Y 바나나라면? 그렇게 유용한 정보는 아닐것이다.

경우에는 Y 인기도에 대해서 전혀 고려가 되지 않았다.

 

베이즈 정리 (Bayes Rule)

통계적 기반이 있는 사람이라면 누구나 들어봤을것이다.

$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$

이를 우리가 가진 문제에 적용해본다면,

$$\frac{P(Y|X)}{P(Y)}$$

X 사람이 Y 확률이, 그냥 Y 확률보다 얼마나 되는지를 있을것이다.

확률이 1 가까워 진다면, X Y 전혀 상관없는 상품이라는 것을 있다.

 

연관성 법칙 (Association Rule)

$$\frac{P(X \land Y)}{P(X) \times P(Y)}$$

두개의 상품을 같이 확률을, 두개의 상품을 각각 확률을 곱한것으로 나누어 본다.

이것은 지향성이 없는 연관성인데, X Y 연관성이 없다는 것을 가정하고 시작한다.

상품을 각각 확률보다 같이 확률이 몇배나 높은지 (혹은 낮은지) 있는 방법이다.

 

)

만약 슈퍼에서 케챱을 확률이 10퍼센트이고, 갈은고기를 확률이 2퍼센트라고 하자. 각각의 확률을 곱하면 2퍼센트가 된다.

하지만 사람들이 갈은고기로 햄버거를 만들어 같이 많이 먹기때문에, 제품을 같이 확률이 80퍼센트라고 하면, 이를 통해 우리는 두개의 상품을 각각 확률보다, 같이살 확률이 4배나 높다는 사실을 있다.

 

모든 추천이 마케팅을 가치가 있는가?

값싼 물건을 고르는 사람에게 연관성이 있다고 해서 비싼 물건을 수는 없을 것이다.

이런 경우가 추천시스템의 강점이 되는데, 프로그램 추천시스템이라면,

연관성이 있다고 해서 무조건 물건을 추천하지 않을것이다.

 

 

본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.

https://www.coursera.org/learn/recommender-systems-introduction?specialization=recommender-systems

728x90
반응형