아카이브/추천시스템(2019)

추천시스템 10 - 컨텐츠 기반 추천

Johnny Yoon 2019. 6. 30. 09:12
728x90
반응형

추천시스템

본 포스팅은 Minnesota대학교의 Intro to Recommender Systems코세라 강좌를 정리한 내용입니다.

https://www.coursera.org/learn/recommender-systems-introduction?specialization=recommender-systems

 

안정적인 선호도로부터 시작

컨텐츠기반 추천에서는 컨텐츠의 속성들을 안정적인 선호도로 선정한다.

)

뉴스

기술관련 뉴스, 대학관련 뉴스, 식당관련 뉴스

면티, 파란색, 저가, 캐쥬얼

영화

행크스, 우디 앨런, 코미디

호텔

24시간 프론트데스크, 룸서비스, Wifi, 수영장

핵심 아이디어

  1. 아이템들의 관련된 속성들을 사용해 모델링을 한다.
  2. 컨텐츠의 속성에 따라서 사용자의 선호도를 노출한다.
  3. 그것은 추천이 된다.

 

컨텐츠 기반 필터링

컨텐츠의 속성이나, 선호도의 키워드들을 벡터로 만든다.

95년도에 어떤 학생들이 Krakatoa Chronicle이라는 웹사이트를 만들고, 기사들을 올려놓았다. 사이트가 동작할 당시에는 기사들에는 게이지들이 표시되어 있었고, 기사들의 순서는 사용자의 선호도를 조금 반영해 배치되어 있었다. 사용자가 기사를 때마다, 시스템은 기사의 키워드들을 사용해 사용자의 프로파일을 조정하고, 기사들의 배치 순서들을 조정했다. 또한 사용자가 기사를 평가하면, 프로파일에 평점을 업데이트 하고, 그것을 기사의 순서에 반영했다.

  • 예제에서는 사용자가 자신의 프로파일을 직접 수정하도록 만들어져 있었지만, 많은 가능성을 보여주었다.
  • 사용자가 아이템을 읽거나, 클릭하거나, 산거나 하는 액션을 취한다면 그것을 통해 사용자의 프로파일 정보를 유추해 있다.
  • 사용자가 평점를 매긴다면, 그것을 직접적인 평가로 사용할 있다.
  • 두가지 카테고리의 정보들을 모아 사용자 프로파일을 만들 있다.

 

사용자 프로파일

그렇다면 사용자 프로파일은 어떻게 구축할 있을까?

  1. 키워드의 집합으로부터 시작해 있을것이다.
    • 사용자가 좋아하거나 좋아하지 않는 아이템에 대한 키워드
  2. 사용자가 관심을 가지는 (혹은 싫어하는) 키워드들을 가진 아이템들의 카운트를 세어볼 있다.
  3. 이제 키워드들의 벡터(집합) 주어지면, 그것을 통해 다른 아이템들에 대한 선호도를 조사해본다.
  4. TFIDF 같은 기법들을 사용한다.

 

사례 기반 추천

이론적으로는, 사용자가 좋아할만한 아이템의 예제들의 데이터베이스가 구축되어 있다.

그리고, 데이터베이스에 쿼리를 하거나, 관련된 정보를 검색한다.

이러한 데이터베이스가 구축되어 있을 때에는, 많은 것을 시도해 있다.

지금은 없는 웹사이트 이지만, etown이라는 회사의 Ask Ida 아래와 같이 시도하였다.

  1. 사용자를 인터뷰해서 속성들에 대한 선호도를 조사하였다.
  2. 선호도를 기반으로 물건을 추천한다.
  3. 추천들을 기반으로 미래의 선호도를 끌어내는 것을 시도했다.
  4. 이러한 프로세스를 반복해 사용자가 원하는 것을 끌어내도록 도와주었다.

위의 예제는 지속적인 선호도가 아니라 현재 상황의 처리만 고려된 모델링이다.

사용자가 현재 원하는 것에만 관심이 있고, 미래에 원하는것은 배제한 모델링이라는 것이다.


지식베이스 기반 추천

지식베이스가 있다면, 이런 사용자 선호도의 예제들을 다른 기법을 사용하지 않고, 살펴보게 있다.

아래의 웹사이트는 Entree라고 하는 웹사이트이다.

사용자가 메뉴를 선정하면 식당을 추천해주고, 시스템은지식베이스를 기반으로 저렴한곳, 또는 특이한곳과 같이 사용자가 원하는 속성들을 갱신해 노출해 있다.

이러한 지식기반 추천시스템은 사용자의 현재 선호도, 장기적인 선호도가 아닌것을 반영해 있다.

 

컨텐츠기반 추천

사례기반과 지식베이스기반은 현재의 관심사에 집중되어 있지만, 일반적인 컨텐츠 기반 추천방법은 조금 선호도, 사용자의 프로파일링을 지향한다.

그런 의미에서 컨텐츠 기반 추천은 다음과같은 도전점과 어려움이 있다:

  • 컨텐츠기반 추천은 프로파일링을 기반으로 하기 때문에 단기적인 추천보다 추천의 이유를 설명하기가 어렵다.
  • 속성들이 사용자의 프로파일링에 구축되어 있다는 것을 전제하고 있기 때문에 특정 도메인에는 적용하기 어렵다. ( 그려진 벽화들을 생각해보자, 그리기 전에는 상상하기 어렵다.)
  • 아이템과 속성들이 분포된 상황에만 사용할 있다. 모든 아이템들이 비슷한 속성을 가지고 있다면 추천을 만들어내기 어렵다.
  • 특이한 취향을 맞춰주기 어렵다.
  • 부수적인 추천을 하기 어렵다.

 

728x90
반응형