본문 바로가기

[Day74] Github 특강 2-1 CLI로 로컬 저장소를 사용하기 1. 폴더 만들기 2. 파일 만들기 3. Init 터미널을 열고 git init 으로 레포지토리를 초기화 해준다. GUI↓ 더보기 GUI 로는 이렇게 해줄 수 있다. 를 해주는 것과 같은 과정이다. 4. Add git status 로 현재 상태를 확인한다. 수정한 파일이 보인다. git add 를 하면 아무 반응이 없다. 그게 맞다 git add . 이 명령어는 현재 폴더의 모든 파일을 add 한다 . 를 습관으로 들이면 좋지 않다. 모든 파일 중에 넣지 말아야 할 것도 있기 때문이다. 다시 git status를 해서 add가 잘 되었는지 확인한다 4-2 .gitignore 항상 add에서 제외 이 프로젝트에서 차원에서의 정책(policy) 파일(project wide). 팀원들도 똑같이 안 쓰게 된다...
[Algorithm] 백준 BOJ 2644 촌수계산 python 파이썬 그래프 DFS 실버 2 Private 난이도 : ♥♥♡♡♡ 2644번: 촌수계산 사람들은 1, 2, 3, …, n (1 ≤ n ≤ 100)의 연속된 번호로 각각 표시된다. 입력 파일의 첫째 줄에는 전체 사람의 수 n이 주어지고, 둘째 줄에는 촌수를 계산해야 하는 서로 다른 두 사람의 번호가 주어 www.acmicpc.net from collections import defaultdict from sys import setrecursionlimit setrecursionlimit(10**6) n=int(input()) # 전체 사람 수 a,b =map(int,input().split(' ')) # 촌수를 구해야 하는 두 사람 m=int(input()) # 관계 수 graph=defaultdict(list) for i in ran..
Wandb Sweep 하는 방법 : 하이퍼 파라미터 자동 튜닝 Wandb는 자동으로 train을 할 때 마다 그 때의 하이퍼 파라미터와를 기록하고 auc, rmse등을 기록해서 보여주는 굉장히 편리한 도구이다. Weights & Biases – Developer tools for ML WandB is a central dashboard to keep track of your hyperparameters, system metrics, and predictions so you can compare models live, and share your findings. wandb.ai 이 Wandb에는 기록뿐 아니라 hyper parameter를 좋은 성능이 나오게 찾아주는 기능도 있다. 1. wandb.log로 loss와 정확도 등 목적 값을 보낸다 wandb.log( {..
[Boostcamp AI tech 3기] Week 15 학습 정리/회고 (4/25~5/1) 학습 정리 강의/스스로 도전 한 것/과제/결과물 DKT Feature engineering 직접 feature 만들고 실험 dart나 나은 성능 실험 Tabular preprocess 만들고 실험 모델 실험 LSTM을 맡아서 sweep 실험 최종 프로젝트 상위 투표된 주제와 멘토님 추천 주제를 직접 데이터를 알아보고 개요를 그려보았다 백준 토마토 재귀시 메모리 초과 원인 알아냄 피어세션 모델 탐색해 주신 것들 기반으로 앞으로 테스트할 모델 선정 Sequential 먼저 끝내자 토론 게시판에 팀 EDA 게시 data 정렬하자 기업연계 최종 프로젝트→Recsys관련은 없었음 valid auc에 비해 제출성능이 너무 떨어지는 경우 → overfitting일까 최종 프로젝트 주제 결정 LGBM 특성 멘토링 우선..
[Algorithm] 백준 BOJ 7576 토마토 python 파이썬 BFS 골드 5 / 메모리 초과 Private 난이도 : ♥♥♥♥♡ 7576번: 토마토 첫 줄에는 상자의 크기를 나타내는 두 정수 M,N이 주어진다. M은 상자의 가로 칸의 수, N은 상자의 세로 칸의 수를 나타낸다. 단, 2 ≤ M,N ≤ 1,000 이다. 둘째 줄부터는 하나의 상자에 저장된 토마토 www.acmicpc.net import sys from collections import deque sys.setrecursionlimit(10**6) n, m= map(int,input().split(' ')) graph=[] for mm in range(m): graph.append(list(map(int, input().split(' ')))) full_count=0 # 총 0의 갯수 = 익어야하는 토마토 갯수 ripe=deque(..
[Boostcamp AI tech 3기] Week 14 학습 정리/회고 (4/18~4/24) 학습 정리 강의/스스로 도전 한 것/과제/결과물 이전 프로젝트에서 보완하고 싶은 점 회고 협업도구 논의 및 setting 프로젝트 시작 문제정의, 목표 EDA Validation set 정의 프로젝트 전체 계획 K-fold Outlier 제거 및 성능 실험 Wandb숙지 및 Sweep 시도 피어세션 각자가 한 EDA 설명 최종 프로젝트 우선순위 매기기 feature engineering을 현업에서 inference하면 이미 처리한 데이터를 사용할까? 아니면 할 때마다 연산을 해줄까? 멘토링 프로젝트 속에서의 나를 다르게 해보자 내가 하고 싶던 직무랑 관련되게 그 포지션을 맡도록 해보아야겠다. 스토리라인 잡기 최종 프로젝트 가이드라인 커뮤니티도 알아보기 공백이 있어도 괜찮다 마스터 클래스 여러 지표를 보는..
[Day 68] DKT 4. Sequence Data 문제 정의에 맞는 Transformer Architecture 설계 Transformer encoder를 활용해서 여러 문제에 적용할 수 있다. transformer는 sequence데이터가 강점을 보이지만 많은 데이터를 요구한다. Inductive Bias CNN은 기본적으로 kernel을 통해서 locality를 보면서 bias를 학습하게 설계되어 있고, RNN은 sequence를 보도록 설계되어 있다(inductive bias가 있다). 이렇게 모델 구조상에서 bias가 있는데, MLP나 transfomer는 bias가 적다. transformer는 inductive bias가 없는 것이 장점이지만 또 단점이 되기도 한다. 데이터에서 다양한 feature를 뽑아내기 위해서는 데이터가 많이 필요하게 되는 것이다. feature engineering가 많이 필요하면 t..
[Algorithm] 백준 BOJ 1260 DFS와 BFS python 파이썬 그래프 실버 2 Private 난이도 : ♥♥♥♡♡ 1260번: DFS와 BFS 첫째 줄에 정점의 개수 N(1 ≤ N ≤ 1,000), 간선의 개수 M(1 ≤ M ≤ 10,000), 탐색을 시작할 정점의 번호 V가 주어진다. 다음 M개의 줄에는 간선이 연결하는 두 정점의 번호가 주어진다. 어떤 두 정점 사 www.acmicpc.net from collections import deque,defaultdict n,m,v=map(int,input().split(' ')) # print(n,m,v) graph=defaultdict(list) nodes=list() for mm in range(m): first, second=map(int,input().split(' ')) graph[first].append(second) g..