검색은 사용자의 의도가 담긴 query라는 키워드가 사용된다.
검색을 통해 아이템을 소비하는 것을 pull이라고 하고, 반대로 추천은 push이다. 의도를 가진 키워드를 제공하지 않더라도 item을 흥미나 의도를 고려해서 아이템을 제공한다.
과거에는 유저가 접근할 수 있는 상품이 적어서 추천이 딱히 필요하지 않았다. 하지만 검색 환경이 좋아지고, 상품과 컨텐츠들도 다양해졌다. 많은 아이템들이 Long tail로 분포되며 소비되고 있다. 이렇게 아이템의 갯수가 많아지면 정보를 찾는 시간이 오래 걸리게 되었다. 또한 유저가 원하는 아이템을 찾기위해 어떤 키워드로 검색해야할지 모를 수도 있다.
인기있는 소수의 아이템이 소비되는 면적보다 다수의 아이템이 적게 소비되는 면적이 넓어지게 하는 것이 Long-Tail 추천이다.
사용 데이터
- 유저 관련 정보
- 유저 프로파일링
유저에 관한 정보를 생성/구축 - 식별자
유저 ID, 디바이스 ID - 데모그래픽 정보
성별, 관심사, 연령: 직접 유저한테 조사받거나 추정 - 유저 행동 정보
페이지 방문기록, 구매 기록
- 유저 프로파일링
- 아이템 관련 정보
- 추천 아이템의 종류
- 아이템 프로파일링
아이템 ID, 아이템 고유정보/meta data
- 유저-아이템 상호작용 정보
유저가 아이템을 소비한 정보/로그/feedback- explicit feedback
유저가 직접 만족도를 평가 - implicit feedback
아이템에 직접 평가한게 아니라 클릭, 컨텐츠소요 시간 등
explicit feedback보다 implicit feedback이 훨씬 많다.
- explicit feedback
문제 정의
- 특정유저에게 적합한 아이템을 추천한다.
- 특정 아이템에 적합한 유저를 추천한다.
유저-아이템 상호작용을 평가할 score가 필요하다. score를 구하는 것이 추천모델을 통해 생성되는 output이다.
- 랭킹 (Ranking)
유저에게 적합한 상위 K개를 추천
score은 정확한 선호도를 구할 필요가 없다. 어차피 내림차순을 하기 때문에 rating과 score의 scale은 달라도 된다.
평가지표 : Precision@K, Recall@K - 예측 (Prediction)
아이템을 가질 선호도를 정확하게 예측
아이템에 대해 유저가 매길 평점이나 클릭 확률을 구한다.
평가지표 : MAE, RMSE, AUC
적용사례
넷플릭스, 쿠팡, 광고
'부스트캠프 AI Tech 3기 > 이론 : U-stage' 카테고리의 다른 글
[Day31] 추천 시스템 Basic 2-1 연관 분석 (0) | 2022.03.07 |
---|---|
[Day31] 추천 시스템 Basic 1-2 추천시스템의 평가 지표와 인기도 기반 추천 (0) | 2022.03.07 |
[Day21] AI 서비스 기초 5. MLflow (0) | 2022.02.20 |
[Day21] AI 서비스 기초 특강 5. AI 시대의 커리어 빌딩 (0) | 2022.02.18 |
[Day20] AI 서비스 개발 특강 4. Full Stack ML Engineer (0) | 2022.02.17 |