추천시스템
아마존과 같은 쇼핑사이트에서 상품을 볼 때, 연관성 있는 제품을 추천해 주는것을 볼 수 있다.
비개인적 추천은 추천을 하기 위한 맥락이 부족하다.
하지만, 연관제품 추천은 이런 상황에서 매우 구체적인 맥락을 만들어준다.
사용자가 현재 보고있는 제품을 맥락으로 보고 관련 제품을 추천할 수 있기 때문이다.
단기적, 맥락적 개인화
이러한 추천은 긴 라이프사이클을 가지지 않는 추천이고, 지금 사용자가 무엇을 하고 있는가에 대한 맥락이 있는 개인화이다.
- 사용자가 이리저리 이동하는 것을 보고 사용자의 현재의 관심을 파악할 수 있다
- 사용자 개인의 선호도에 대한 오래된 시간적인 정보를 반영하지는 않는다.
추천 계산법
수작업: 교차판매표
- 수작업으로 교차판매표를 만들어, 특정 상품과 연관성있는 상품을 추천할 수 있는 로직을 만든다
- 예를 들어, TV를 사려는 사람이 있다면, TV와 관련된 HDMI케이블이나, 전원케이블 등을 추천할 수 있을것이다.
데이터 마이닝: 연관성 분석
- 현재 맥락에서 가장 살만한 물건인가?
간단한 예제로 시작해보자:
X라는 물건을 이미 산 사용자가 Y라는 물건을 샀다고 하자. 얼마나 많은 X를 산 사람이 Y를 사는가를 계산한다.
$$\frac{X \land Y}{X}$$
이러한 방법이 정말로 효율적인가?
만약 X가 멸치이고 Y가 바나나라면? 그렇게 유용한 정보는 아닐것이다.
이 경우에는 Y의 인기도에 대해서 전혀 고려가 되지 않았다.
베이즈 정리 (Bayes Rule)
통계적 기반이 있는 사람이라면 누구나 들어봤을것이다.
$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$
이를 우리가 가진 문제에 적용해본다면,
$$\frac{P(Y|X)}{P(Y)}$$
X를 산 사람이 Y를 살 확률이, 그냥 Y를 살 확률보다 얼마나 되는지를 알 수 있을것이다.
이 확률이 1에 가까워 진다면, X와 Y는 전혀 상관없는 상품이라는 것을 알 수 있다.
연관성 법칙 (Association Rule)
$$\frac{P(X \land Y)}{P(X) \times P(Y)}$$
두개의 상품을 같이 살 확률을, 두개의 상품을 각각 살 확률을 곱한것으로 나누어 본다.
이것은 지향성이 없는 연관성인데, X와 Y가 연관성이 없다는 것을 가정하고 시작한다.
상품을 각각 살 확률보다 같이 살 확률이 몇배나 높은지 (혹은 낮은지)를 알 수 있는 방법이다.
예)
만약 슈퍼에서 케챱을 살 확률이 10퍼센트이고, 갈은고기를 살 확률이 2퍼센트라고 하자. 각각의 확률을 곱하면 2퍼센트가 된다.
하지만 사람들이 갈은고기로 햄버거를 만들어 같이 많이 먹기때문에, 두 제품을 같이 살 확률이 80퍼센트라고 하면, 이를 통해 우리는 두개의 상품을 각각 살 확률보다, 같이살 확률이 4배나 높다는 사실을 알 수 있다.
모든 추천이 마케팅을 할 가치가 있는가?
값싼 물건을 고르는 사람에게 연관성이 있다고 해서 비싼 물건을 팔 수는 없을 것이다.
이런 경우가 추천시스템의 강점이 되는데, 잘 프로그램 된 추천시스템이라면,
연관성이 있다고 해서 무조건 물건을 추천하지 않을것이다.
본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.
https://www.coursera.org/learn/recommender-systems-introduction?specialization=recommender-systems
'데이터사이언스 > 추천시스템' 카테고리의 다른 글
추천시스템 - (9) 컨텐츠 기반 추천 (0) | 2020.07.19 |
---|---|
추천시스템 - (8) 연관성 분석 추천 예제 (0) | 2020.07.12 |
추천시스템 - (6) 인구통계 (0) | 2020.02.23 |
추천시스템 - (5) 기술통계 (0) | 2020.02.21 |
추천시스템 - (4) 추천 알고리즘 (0) | 2020.02.21 |