본문 바로가기

[Day62] DKT 3. Baseline (LGBM, LSTM, Transformer) Sequence 모델링 transcaction data 같은 sequence data를 사용하기 위해서는 feature engineering을 통해 집계해서 non-sequence하게 만들어 사용할 수도 있다. 집계 : Aggregation 다음과 같은 방법으로 feature engineering을 해서 사용할 수 있다. 여러 유저의 신용카드 사용 내역이 있다고 하면 한 유저에 대해서 여러 사용내역이 있게 되고 이것을 한 유저에 대해서 집계할 수 있다. categorical 변수같은 경우는 많이 나온 한 카테고리를 선택할 수도 있다. null이 아닌 것의 횟수를 센다 연속형 변수면 평균을 취한다 하지만 집계하는 과정에서 정보들이 많이 손실된다. 집계하지 않고 transaction을 그대로 sequence..
[Day62] DKT 1. DKT 이해 및 DKT Trend 소개 DKT Task 이해 DKT : Keep Knowlege Tracing : DL + KT 교육AI의 중심에 있다. KT : Knowledge Tracing 지식 구성 요소(Knowledge component, ex. 일차방정식)에 대한 학생의 이해도를 지식 상태(Knowledge state)라 하고, 지식 상태는 계속해서 변화하며 그 상태를 지속적으로 추적하는 것 문제 풀이 정보(문제를 맞았는지 틀렸는지)로 지식상태를 추적하는데, 당연히 문제 풀이 정보가 많아질 수록 지식 상태를 더 정확하게 예측할 수 있다. 데이터가 적을수록 over-fitting 이 쉽게 일어난다. 가지고 있는 지식 상태에 대한 정보를 기반으로 다음 문제를 맞출 수 있을지를 예측한다. 문제추천이나 학업도를 파악하는데 쓰일 수 있다. ..
[Boostcamp AI tech 3기] Week 13 학습 정리/회고 (4/11~4/17) 학습 정리 강의/스스로 도전 한 것/과제/결과물 SVD로 user based CF 구현 FFM data preprocessing train, inference 연결 EDA bad user sequence 하루만 사용한 유저 Idea 내기 Multi-VAE ML flow 연결 최종 프로젝트를 위한 데이터 사이트 알아보기 weighted hard voting 구현 앙상블을 위한 각 계열의 모델 중 최적의 모델 선정하기 발표 PPT 만들기 Wrap up report 작성 피어세션 Rule base by Genre Bad user 아이디어 회의 장르간의 상관관계 효율적으로 코드 수정 vstack->list append 멘토링 통합멘토링 EDA 내용 Bert4Rec 질문 팀 멘토링 Movie recommendat..
[Boostcamp AI tech 3기] Week 12 학습 정리/회고 (4/4~4/10) 학습 정리 강의/스스로 도전 한 것/과제/결과물 Mult-VAE 논문 리뷰 읽고 구현 KPT 회고 시도 일별 체크리스트를 만들어서 할 일들을 정리하고 공유하기로 함. 소통을 좀 더 원활하게 하기 위해서 노력하자 -> daily checklist를 만들었음 rule-base by year 사용자의 서비스 사용기간 이후에 나온 영화들은 제거하고, 나머지는 많이 본 것 위주로 추천 -> 미래의 영화를 제거하는 것은 완전히 합리적이라고 판단 CL4SRec 간단히 알아보기 문제를 다른 관점에서 바라보기, 아이디어 제시 프로젝트 다시 세우기 최종 프로젝트 논의 성격테스트 등 Temporal Split 적용해보자 Mult_VAE base code 구현 논문 inference의 오점 발견 및 수정 ->재 indexin..
[Boostcamp AI tech 3기] Week 11 학습 정리/회고 (3/28~4/3) 학습 정리 강의/스스로 도전 한 것/과제/결과물 Movie Rec 8,9,10 초벌로 듣기 Movie Rec 4 다시 듣기 이고잉님 깃허브 특강 다시 듣기 S3Rec 논문 스터디 준비 baseline 코드 분석 Competition 계획 + 팀 나누기 ->CF팀 user-based CF, item-based CF 구현 Multi-VAE 초안 구현 피어세션 S3Rec : 논문 읽기 + 토론 + baseline 코드 분석 -> 노션에 기록+PPT대신 팀의 목표와 개인 목표를 확실히 하고 이룰 수 있게 계획을 짜보자 CB팀 CF팀으로 나누어서 대회 진행 baseline 코드가 어렵고 SOTA여서 1) 처음접하기에 어렵고 2) 할 수 있는 것이 많지 않아서 힘들다는 팀원들의 의견 Competition 3000개..
[Day36] Github 특강 1-8 HEAD, master, branch git log 지금까지 commit한 내역들을 보는 명령어이다 git log --oneline git log --oneline --graph 으로 보면 좀 더 깔끔하고 그래프로 볼 수 있다. 상단에 메뉴에서 터미널-새터미널로 열어서 입력하면 이렇게 내역들이 나온다. HEAD HEAD가 master를 가리키고, master은 최신 commit인 v2를 가리키고 있는 상태이다. 이것을 git graph로 보면 이 상태이다. 노랑으로 내가 동그라미 친 저 표시가 head가 저 commit에 있다는 것을 가리킨다. HEAD가 master를 가리키고 있다는 뜻에서 master의 테두리가 진한 것(=색이 있는 상태)이다. 이 상태가 HEAD가 master를 가리키지 않고 이 commit을 직접 가리키는 상태이다. ..
[Day36] Github 특강 1-7 Git 충돌(conflict) 해결 과정 : 머지(Merge) (VSCode) Pull을 할 때 내 코드와 비교해서 추가된 부분은 문제없이 추가된다. 내 코드에서 처음으로 더 추가된 부분도 문제없이 추가된다. 같은 라인에서 다른 변화가 Pull의 내용과 내 commit내용에 있을 때 충돌이 일어난다. Current Change는 내 commit내용(R4) L4는 Pull해서 들어오게 된 내용(L4) 이다. Accept Current Change : 내 commit내용으로 바꾸겠다 -> R4 Accept Incomming Change : Pull로 들어오게 된 내용으로 바꾸겠다 -> L4 Accept Both Changes : 양 쪽 내용을 모두 쓰겠다 ->R4 L4 Compare changes : 비교해보겠다 아래와 같이 비교하는 창을 띄워준다. Mergetool이라는 것을 다운받..
[Day36] Github 특강 1-6 Git Clone 레포지토리/저장소 복제 (VSCode) 1. HTTPS 복사 복제를 원하는 레포지토리에 들어가서 HTTPS를 복사한다. 2. VScode 새 창 VScode에서 새 창을 열어준다. 3. 리포지토리 복제 (Git Clone) 소스제어로 가서 리포지토리 복제를 클릭 4. HTTPS 붙혀넣기 1번에서 복사한 링크를 붙혀 넣는다. 5. 복제할 위치 선택 그러면 창이 뜨는데 복제할 리포지토리의 위치를 선택하는 것이다. 새 폴더를 만들어서 그 폴더를 선택해준다. 6. 열기 오른쪽 밑에 알림이 뜨는 것을 클릭해서 열기를 누르면 그 폴더로 vscode가 다시 열린다 복제 끝!