欲速不達

일을 급히 하고자 서두르면 도리어 이루지 못한다.

Fantastic AI, Fantastic World
728x90
반응형

recommendation system 5

[논문] LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation

1. Background 기존의 CF( Collaborative Filtering )에는 다음과 같은 가정이 존재한다.비슷한 행동을 하는 유저들이 비슷한 아이템을 선호할 것이다.  이러한 가정에서 유저들이 갖는 성향을  잠재요인( Latent Factor )이라고 하며, 직접적으로 관찰되거나 측정되지 않는 요인을 말한다. CF는 유저와 아이템 각각의 임베딩 벡터를 생성하고, 내적을 통해 유저가 선호할만한 아이템의 스코어를 계산한다. 이에 더해 그래프에 기반한 추천모델인 NGCF( Neural Graph Collaborative Filtering )는 유저와 아이템 임베딩 벡터를 Embedding Propagation Layer를 통과시켜 업데이트함으로써 유저가 선호할만한 아이템의 스코어를 계산하여 추천한..

[RecSys] kNN Collaborative Filtering : scikit-surprise 라이브러리 / MovieLens Data

!pip install scikit-surprise scikit-surprise 패키지는 Collaborative Filtering 관련 머신러닝 라이브러리이다. kNN 뿐만 아니라 MF 등의 알고리즘도 제공하지만 여기서는 kNN 알고리즘만 사용했다. - Reader, Dataset from surprise import Reader, Dataset reader = Reader(rating_scale=(0.5, 5.0)) data = Dataset.load_from_df(ratings_df[['userId', 'movieId', 'rating']], reader) - train_test_split from surprise.model_selection import train_test_split # train..

[RecSys] Basic - 3

인기도 기반 추천 / 평가지표 - MovieLens 데이터셋 가공 - 가공한 데이터 활용 -> 인기도 기반 추천 - 평가지표 1. 전처리 MovieLens 100k Dataset - 원천데이터 https://grouplens.org/datasets/movielens/ MovieLens GroupLens Research has collected and made available rating data sets from the MovieLens web site ( The data sets were collected over various periods of time, depending on the size of the set. … grouplens.org 데이터 구성 영화에 대한 제목, 장르, 연도 등의 데이..

[RecSys] Basic - 2

(1) 추천시스템은 다른 분야(CV, NLP)에 비해 딥러닝 모델과 전통적인 머신러닝 모델의 성능차이가 Dramatic하지 않다. (2) 현업에서는 규모가 큰 데이터의 트래픽을 감당해야한다 -> 모델의 Inference time(모델 서빙의 latency)가 중요해짐 -> 근데 딥러닝 모델은 아무래도 무겁기 때문에, 성능차이가 아주 크지 않는 이상 장점이 적음 위의 두 가지 이유로 추천시스템에서는 클래식한 머신러닝 모델도 아직 많이 사용하고 있다. 클래식한 모델은 연관분석(Association Rule Analysis / Association Rule Mining), Content-based Recommendation, Collaborative Filtering, Item2Vec Recommendatio..

[RecSys] Basic - 1

1. 추천 시스템 : Recommender System - 필요성 1) 과거에는 유저가 접할 수 있는 상품, 컨텐츠가 제한적 -> 적은 수의 매체 2) 웹/모바일 환경 -> 다양한 상품과 컨텐츠를 쉽게 접할 수 있게 만들어줌 정보가 많아짐 Long Tail Phenomenon 발생 - 정보를 찾는 데 오히려 시간이 오래 걸림 / 유저가 어떤 키워드로 찾아야할지 모를 수 있음 : 개인화/맞춤 서비스로 발전 2. 추천 시스템에서의 정보(Information) 1) 유저 관련 정보 : User Information - 유저 프로파일링 : User Profiling : 추천대상이 되는 유저에 관련된 정보를 구축, 개별 유저 혹은 그룹별로 추천하기 위한 목적 식별자 : 유저 ID, 디바이스 ID, 브라우저 쿠키 ..

728x90
반응형