본문 바로가기
성장하기

[서평] 데이터 과학을 위한 통계

by 예시카의 일상 블로그 2021. 5. 24.

#데이터과학 #통계핵심 #데이터분석 #머신러닝통계 #통계추천

작년부터 인공지능과 딥러닝을 공부하면서 통계 기초가 정말 중요하다는 것을 절감했다.

데이터 분석과 머신러닝, 더 나아가 딥러닝을 하기 위해서는 통계의 핵심 내용을 이해해야 그다음 단계로 나아갈 수 있기 때문이다. 

특히, 모두의연구소 인공지능혁신학교 AIFFEL 졸업하고 퍼실로 학생들을 코칭하는 입장이 되어보니 더 절실할 수밖에 없었다.

근데, 생각보다 데이터 과학에 정말 필요한 부분만 추려서 핵심 개념을 이해하기 쉽게 정리된 책을 찾기 어려웠다.

최근에 출간된 '데이터 과학을 위한 통계'는 정말 최고의 책이라고 추천할 수 있다. 

캐글 대회라도 나갈 때 가장 기본 중 기본이라 할 수 있는 '탐색적 데이터 분석(EDA, Exploratory Data Analysis)'의 기본 개념과 시각화 부분으로 시작해서, 데이터와 표본 분포, 통계적 실험과 유의성 검정, 회귀와 예측, 분류, 통계적 머신러닝, 비지도 학습으로 목차가 정말 필요한 부분으로 잘 짜여 있다. 

최근에 추천 분야를 공부하면서 '멀티 암드 밴딧(MAB, Multi-armed bandit) 알고리즘'을 스터디 친구들과 함께 파고 있는데, 어쩜 이렇게 쉽게 설명해 주고 있는지 감탄하면서 읽었다. '톰슨 샘플링(Thompson's sampling)'의 '베타 분포(Beta Distribution)'를 이렇게 짧고 간단하고 명쾌하게 설명해 주다니! 이 개념을 제대로 알고 그때 공부를 했더라면 시간을 얼마나 절약할 수 있었을까? 역시 통계는 기초 공사가 탄탄해야 그 위에 쌓이는 지식들이 무너지지 않는 것 같다. 

또한 마케팅 그로스 해킹 분야에서 가장 많이 사용되는 A/B 테스트 실험 설정을 위해서 기초적으로 알아야 할 통계 개념과 유의성 검정 방법에 대해서 정말 쉽게 정리되어 있다. 

중간에 필요한 주요 코드들은 파이썬과 R로 제공되고 있으므로, 본인이 적용해 보고 싶은 프로그램 코드에 바로 삽입해서 돌려볼 수도 있다. 

이 책의 뒷부분에도 강조되어 있는데, '파이썬과 R로 필요한 만큼만 배우는 실용주의 통계학'이라는 설명이 정말 딱 들어맞는다고 볼 수 있다. 

데이터 분석가를 지향하거나, 머신러닝이나 딥러닝을 공부하는데 통계적인 기본 지식이 없어서 계속 방해받는다는 느낌이 드신다면 이 책을 통해서 그 답답함을 해소하시길 권해드린다. 

이 책을 6개월 전에 알았더라면 모두연 AIFFEL 퍼실을 진행할 때 훨씬 학생들에게 도움이 많이 줬을 텐데, 지금 알게 되어 좀 미안하다는 생각이 든다. ^^

데이터 과학을 위한 통계 2판 - 한빛 미디어

 

※  한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

'성장하기' 카테고리의 다른 글

[독서토론회] 팬덤 경제학  (2) 2021.05.31
[서평] 팬덤 경제학  (0) 2021.05.24
[서평] 데이터 브랜딩  (0) 2021.05.23
[서평] 삼성이 철학하는 이유  (1) 2021.05.22
[서평] 친절한 딥러닝 수학  (0) 2021.04.18

댓글