본문 바로가기
성장하기

[E-9] 나의 첫 번째 캐글 경진대회, 무작정 따라해보기

by 예시카의 일상 블로그 2021. 2. 2.

Opening


  • 데이터 요모조모를 호기심 관점에서 톺아보기
    • 분석을 하기 전에는 도메인 지식을 갖고 있다면 매우 큰 도움이 됩니다. 
    • 다루는 데이터에 대한 배경지식이 부족하면 아무래도 중요하지 않는 부분에서 시간을 많이 보낼 수가 있거든요.
    • 캐글의 진미는 사전에 어떤 관점에서 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 하고
    • 이를 기반으로 어떤 전략으로 풀어나가는 전략을 수립했는지 여부라고 해도 과언이 아닙니다. 
    • 이미 끝난 대회를 우승하고 것에 목표를 두기보다는 나는 어떤 관점에서 데이터를 바라봤는지에 대해서
    • 본인만의 경험과 노하우를 차근 차근 쌓아가지는 것을 추천드립니다. 
  •  
  • 평상시에도 캐글 사이트에 자주 방문하기
    • 평상시에도 습관적으로 어떤 문제가 새로 출제되었는지 파악하기 위해서
    • 그러다가 관심 있는 주제에 대해서 좀 더 깊이 탐구해 보면
    • 요새 데이터를 활용해서 어떤 문제를 해결하고 있는지 데이터 분석 트렌드에 대한 감을 가질 수 있습니다.
    • 그동안 본인이 참여했던 캐글 대회가 있다면 어떤 주제였었는지,
    • 앞으로 관심을 갖고 참여하고 싶은 캐글 대회가 있다면 어떤 영역인지 함께 토론해 봅시다.

 

Check-up 항목


 

★ 오늘 노드의 주요 내용을 훑어봅니다! 정리가 정말 깔끔하게 잘 되어 있네요!

  • 대회의 시작
    1. 참가규칙, 평가기준
    2. 데이터 살펴보기
  • 일단 제출하고 시작해! Baseline 모델
    1. Baseline 세팅하기
    2. 라이브러리, 데이터 가져오기
    3. 데이터 이해하기
    4. 모델 설계
    5. 캐글에 첫 결과 제출하기

  • 랭킹을 올리고 싶다면?
    1. 다시 한번 내 입맛대로 데이터 준비하기
    2. 다양한 실험을 위해 함수로 만들어 쓰자
    3. 하이퍼 파라미터 튜닝의 최강자, 그리드 탐색
    4. 제출하는 것도, 빠르고 깔끔하게!
  • 프로젝트: This is your playgrond!
    1. Leaderboard를 정복해주세요!
    2. 프로젝트 제출

 

Closing


  • 본인만의 캐글의 리더 보드와 게시판을 활용하는 방법에 대해서 토론해 봅시다.

 

참고자료


 

Hello Kaggle! 캐글이 처음인 분들을 위한 캐글 가이드

Hello Kaggle은 제가 직접 작성한 문서이며 아래는 문서의 깃허브 레포지터리 링크입니다. 만약 Hello Kaggle이 도움이 되셨다면 🌟 꾸욱 눌러주시면 감사하겠습니다!

velog.io

 

Kaggle.com Trending Datasets

 

댓글