본문 바로가기

부스트캠프 AI Tech 3기/회고

[Boostcamp AI tech 3기] Week 11 학습 정리/회고 (3/28~4/3)

학습 정리

강의/스스로 도전 한 것/과제/결과물

  • Movie Rec 8,9,10 초벌로 듣기
  • Movie Rec 4 다시 듣기
  • 이고잉님 깃허브 특강 다시 듣기
  • S3Rec 논문 스터디 준비
  • baseline 코드 분석
  • Competition 계획 + 팀 나누기 ->CF팀
  • user-based CF, item-based CF 구현
  • Multi-VAE 초안 구현

피어세션

  • S3Rec : 논문 읽기 + 토론 + baseline 코드 분석  -> 노션에 기록+PPT대신
  • 팀의 목표와 개인 목표를 확실히 하고 이룰 수 있게 계획을 짜보자
    CB팀 CF팀으로 나누어서 대회 진행
  • baseline 코드가 어렵고 SOTA여서 1) 처음접하기에 어렵고 2) 할 수 있는 것이 많지 않아서 힘들다는 팀원들의 의견
  • Competition
    • 3000개 이상 영화를 본 사람 등등 기준을 세워서 outlier 처리를 해보자
    • attribute 추가해서 활용해보자
    • boosting계열이 성능이 좋다는데 시도해보자는 의견
  • AutoRec 데이터를 어떻게 분할할 수 있을지 
    • Random sampling
    • user별
  • 한 영화당 해당하는 장르가 여러 개인데, 이를 임베딩할 수 있는 방법
  • CTR모델을 튜닝해서 top-k로 만들어도 될까?

멘토링

  • 논문 스터디 방향
    • 한 명당 한 논문을 발표하니까 너무 길어지고 기억도 잘 안나니까 조별로 하나만 하는 것으로 결정
    • 1시간 이내로 하되, 그 안에서는 구현을 더 해봐도 되고 다른 논문을 하나 더 가져와도 괜찮음
  • 통합멘토링
    • 다른 조 : 모델조사 + 모듈화 + 이상치 탐지
      기록(노션+github 이슈)을 열심히 하고 있고, 순위을 올리기 보다는 공부가 되는 쪽으로 한다.
    • 하이브리드 모델을 사용해야할 것 같다.
  • 팀 멘토링
    • task가 다른 모델을 사용해도 될까?
    • train,valid, test 셋 나누는 기준 : recsys
    • DL 질문 : 하나를 해도 정확하게 해보자
    • 최종 프로젝트 조금 준비 시작해보기
    • 개인 멘토링 다음주중에 꼭 신청하기
    • 같은 팀안에서 사용한 서로의 모델 알고 있기
    • 강의(Movie 8,9,10)에 대한 추가 질문
    • further question들 답해보기

회고

아쉬운 것

  • 논문 읽기가 시간이 오래 걸린다
  • 코드 저장을 하자
  • AutoRec
    task 전환의 실패인지 loss function을 고쳐도 큰 변화가 없어서 아쉽다

잘 한 것

  • user-based CF가 생각보다 좋은 성능이 나와서 신기하면서도 문제 정의를 다시 해야할지 고민이 된다. 간단한 모델이라서 S3Rec이 성능을 발휘하지 못하는 것일지 잘 모르겠다.
  • 대회를 포기하지 않고 다시 계획을 세워서 시작해 본 것

기타 느낀 것

  • 데이터의 변환 보다는 아이디어를 반영하기 위해서는 모델을 만져야하는 것 같다.

 

다음 주

  • Multi-VAE 도전하고 CF 정리하기