欲速不達

일을 급히 하고자 서두르면 도리어 이루지 못한다.

Fantastic AI, Fantastic World
728x90
반응형

한 눈에 보기 3

[RecSys] 한 눈에 보기 정리 - 5 : Model-based Collaborative Filtering

Model-based Collaborative Filtering이 필요한 이유 Memory-based CF의 문제점 희소 데이터 문제 : sparse data interaction의 수가 적음 -> 모델 성능 저하 cold start가 어려워짐 user interaction이 sparse matrix면, 유사도를 계산하기가 어려움 -> 유사도 행렬의 신뢰성 저하 확장성의 문제 : scalability 데이터가 많아질수록 연산량 증가 업데이트 될때마다(데이터 추가, 변경) 새로 user-item matrix를 연산해야함 실시간으로 연산하기에는 부적합 Model-based CF의 장점 데이터 패턴을 학습 -> 단순히 항목 간 유사성을 비교하는 것 X user-item 관계의 잠재적 특성 및 패턴을 찾을 수 ..

[RecSys] 한 눈에 보기 정리 - 3 : Content Based Recommendation System

Content : 아이템의 성질 및 특성 --->>> 사용자가 특정 아이템을 선호하는 경우, 그거랑 비슷한 Content를 가진 아이템을 추천 1. Vectorization : 아이템 특성을 벡터 형태로 어떻게 표현할지가 중요한 포인트 One-hot encoding 인코딩을 하려고 하는 항목의 수에 따라 On-hot 차원이 달라지기 때문에, 항목 수가 많아지면 차원이 커지고 그만큼 sparse하게 됨 - High Sparsity Embedding TF-IDF : 다른 문서에는 많지 않고, 해당 문서에서 자주 등장하는 단어에 높은 값을 부여 / 문서를 대표하는 특징 추출 Word2Vec : 단어의 의미를 다차원 공간에 벡터화하는 방법을 사용 / 단어 간 의미적 유사성을 벡터화 Transdormer의 Att..

[RecSys] 한 눈에 보기 정리 - 2

1. 추천시스템이 필요한 이유 사용자가 정보를 찾는데 소요되는 시간을 효과적으로 감소시키는 것 사용자의 관심사에 해당되는(유사한) 컨텐츠(아이템)을 추천하여, 선택의 폭을 확장시키는 것 Push & Pull Push : 사용자가 관심을 가질 만한 정보를 시스템이 Push해줌 Pull : 사용자의 의도가 명확하여, 사용자가 해당되는 항목을 Pull하는 것 ex) 검색 결정피로 : 방대한 정보 속에서 원하는 정보 찾기 위한 피로도 ---->>>> 원하는 정보를 잘 필터링하고 추천해주는 시스템이 필요 2. 추천시스템 workflow 1) 데이터 : user-item 관련 데이터 / interaction, feedback 등 2) Task 설정 - 단기 목표 : 클릭 수, 특정 기간의 총 수익 등 - 장기 목표..

728x90
반응형