본문 바로가기

[Day41] Movie Rec 4. Collaborative Filtering (2) Deep Learning-based Collaborative Filtering 추천시스템에서 DL 모델의 장점 Nonlinear Transformation을 활용해서 복잡한 user-item interaction을 포착한다. 강력한 representation learning 능력을 가지고 있기 때문에 feature engineering에 많이 노력하지 않아도 된다. 비디오, 사진, 음성 등다양한 heterogeneous(여러 다른 종류들로 이뤄진) 정보를 포함할 수 있다. sequence modeling이 가능하다 다양한 network 구조들을 쉽게 결합할 수 있다. 추천시스템에서 DL 모델의 한계 어떤 weight가 어떤 의미를 갖는지 해석할 수 없다. 많은 양의 데이터가 성능을 위해 필요하다. 하이퍼..
[Day33] RecSys with DL 6-1 RecSys with DL/MLP 추천시스템 분야는 다른 분야에 비해서 ML 모델에 비해 월등히 성능이 좋지는 않다. latency를 고려해서 복잡한 모델을 사용하기도 어렵다. 그래도 연구가 이루어지고 있기 때문에 딥러닝을 이용한 추천모델을 알아보자 추천시스템에서 딥러닝을 활용하는 이유 Nonlinear Transformation 데이터가 가진 비선형의 패턴을 효과적으로 나타내고 모델링할 수 있다. 추천시스템에서 ReLU와 같은 비선형함수들이 복잡한 user-item interaction pattern을 효과적으로 모델링하여 큰 도움을 준다. MF는 유저와 아이템을 임베딩한 이후에는 dot product(내적)라는 선형결합을 해서 선호도를 예측했다. 다른 모델들도 선형으로 모델이 설계되어 있는 경우가 많다. 이런 가정은 모델을 단순화하고..
[Day32] Collaborative Filtering 3-1 CF & Neighborhood-based CF 협업 필터링 CF : Collaborative Filtering 많은 유저들(collaborative)로부터 얻은 정보를 이용해 유저의 관심사를 자동으로 예측 데이터가 축적될 수록 협업의 효과가 커지는 것은 머신러닝 모델에서도 학습데이터가 많아지면 성능이 좋아지는 것과 같다. ex) 노트북을 본 유저들이 구매한 다른 상품 추천 유저가 아이템에 부여할 평점/선호도/클릭확률을 예측하는 것이 목표이다. 방법 유저-아이템 행렬을 생성한다. 유저-아이템 행렬에는 유저가 아이템에 대해 기록한 선호도나 평점같은 것이다. 하지만 이 행렬은 다 채워지기 힘들다. 유저가 모든 아이템에 대해서 선호도를 표시할 수 없기 때문이다. 유사도 기준을 정하고, 유저끼리 혹은 아이템간의 유사도를 구한다. 비어있는 값을 주어진 평점과 ..