아카이브/추천시스템(2019)

추천시스템 2 - 선호도

_금융덕후_ 2019. 6. 26. 22:09
728x90
반응형

추천시스템

본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.

https://www.coursera.org/learn/recommender-systems-introduction?specialization=recommender-systems

 

서론

지난 강의에서 비개인적추천에 대해서 이야기 했다.

비개인적추천이란 사용자의 선호도가 고려되지 않은 추천이다.

이번에는 개인적추천과 비개인적추천 모두에 사용되는 데이터가 어떻게 발생되고 모아지는지에 대해서 이야기 한다.

 

추천을 하기 위해서는, 사용자가 어떤것을 좋아하는지에 대한 데이터와 어떤것들이 연관성이 있는지에 대한 데이터가 필요하다. 많은 시스템들에서 이러한 데이터들은 어떠한 방식으로든 사용자에게서 모은다. 어떤 데이터가 모아지는지, 데이터들이 어떤 의미인지에 대해서 알아보려 한다.

 

선호도 모델

우리는 선호도가 무엇인지 알아야 한다.

선호도는, 사용자가 액션 영화를 좋아하는지, 또는 어떤 물건들이 연관성이 있는지와 같은 방대한 범위의 데이터이다.

 

사용자들은 선호도를 나타내기 위해 어떤 행위를 하는가?

사용자들은 선호도를 나타내기 위해서 직접적으로 평점을 매기거나 물건을 구매한다.

그림에 나온 행위들은 액션의 정도나 영향력이 다르다.

직접적(Explicit)

간접적(Implicit)

Rating

Review
Vote

Click
Purchase
Follow

직접적인 행위들은 직관적이고 알기 쉽다.

하지만 우리는 반복되는 간접적인 행위로부터도 사용자의 선호도를 알아낼 있다.

 

직접적 선호도

직접적 선호도를 얻는 가장 쉬운 방법은 사용자가 어떻게 생각하는지 직접 물어보는 것이다.

 

별점 선호도

가장 많이 쓰이는 방법이다. 넷플릭스의 별점선호도는 1 ~ 5점까지 사용자가 평점을 있다. 여러가지 디자인적인 결정들( 반개, 별의 의미 ) 있다. 이런 디자인적인 결정들은 조금 많은 정보를 모으는데 도움이 있다.

 

 

 

 


좋아요

Up/Down으로 표시하는 선호도 방법이다. 판도라는 노래에 대해서 Up/Down으로 평가하는 방식을 선택했다. 변형으로는 Down이나 마이너스가 있지 않고, Up 숫자만 표시하는 방법도 있다. 좋아요 방식은 일반적으로 수명이 짧은 아이템들에 주로 사용된다. 이러한 방법은 사용자가 매우 간편하게 평점을 매길 있게 해준다. 또한 좋아요 방식은 비개인적인 추천에 사용하기 유용하다.

 

 

 


기타 방법들

  • 연속적인 스케일의 점수
  • 아이템이 다른 아이템보다 나은지 비교
  • 하이브리드

 

선호도가 주어지는 시기

소비

    • 소비중 혹은 소비 직후에 주어진다.
    • 시간에 의해 희미해지지 않기 때문에 평가에 가장 효과적인 시점이다.

기억에 의해

    • 소비 어느 시점에 주어진다.

기대치에 의해

    • 소비는 하지 않았지만, 사진이나 설명을 이용해 간접적으로 평가한다.
    • 대체적으로 높은비용이 들지만 적은 분량의 물건들에 적합하다.
    • 자동차나 집과 같이 많은 사람들이 없는 물건에 쓰인다.

 

직접적 선호도의 어려움들

선호도가 믿을만 하고 정확한가?

  • 사용자들이 평가를 하면 언제나 노이즈가 포함되어 있다.

사용자들이 선호도가 바뀌지는 않았는가?

  • 2년전에는 좋은 선호도였지만, 시점에는 아닐 있다.

평점이 어떤 의미인가?

  • 점수 평점은 어떤 의미이고, 좋아요는 어떤 의미인지 상황에 따라 다를 있다.

 

간접적 선호도

  • 사용자들의 행위에 의해 모아진 정보이다.
  • 사용자는 다른 의미로 취한 행위일 있지만, 많은 정보를 얻을 있다.
  • 사용자들은 기사를 읽고 평점을 주지 않을 있지만, 사용자가 기사에 자주 들어가거나, 오래 머물러있거나, 많은 사람들이 기사에 자주 들어가는 행위의 정보들은 매우 유용하다.
  • 링크 클릭, 구매, 팔로우와 같은 이항적인 행위들이 주로 이뤄진다.

 

간접적 선호도의 어려움들

행위가 어떤 의미인가?

  • 물건을 구매를 했지만 좋아하지 않을 수도 있다.
  • 기사를 클릭하고 대충 보고 넘겼을 수도 있다.

행위는 어떻게 수치화 할까?

  • 이항적이기 때문에 수치화가 쉽지 않다.
  • 행위가 중첩되었다면 어떤 의미인지 알기 어렵다.

시스템이 행위에 반응할 사용자들의 반응은?

  • 사용자가 원하지 않는 행위를 시스템이 있다.
  • 이러한 현상들은 교육에 의해 완화될 있다.
728x90
반응형