파이썬 머신러닝 완벽 가이드
Table of contents
Section 0. 강좌 소개
- 강좌 소개
Section 1. 파이썬 기반의 머신러닝과 생태계 이해
- 머신러닝의 개념
- 파이썬 기반 머신러닝의 특징 및 장점과 구성 요소
- 파이썬 기반 머신러닝을 위한 SW의 설치
- 주피터 노트북 사용법과 넘파이/판다스의 필요성
- 강의에 사용될 예제 소스 코드 다운로드 받기
- 넘파이 배열 ndarrary 소개
- 넘파이 배열 ndarrary 초기화 방법과 ndarrary 차원과 크기를 변경하는 reshape()의 이해
- 넘파이 ndarrary의 인덱싱(Indexing)을 통한 데이터 세트 선택하기 - 01
- 넘파이 ndarrary의 인덱싱(Indexing)을 통한 데이터 세트 선택하기 - 02
- 넘파이 ndarrary의 정렬과 선형대수 연산
- 판다스(Pandas) 개요와 기본 API - 01
- 판다스(Pandas) 개요와 기본 API - 02
- 판다스 DataFrame의 변환, 컬럼 세트 생성/수정, 삭제 및 Index 객체 소개
- 판다스 데이터 셀렉션과 필터링 - 01
- 판다스 데이터 셀력션과 필터링 - 02
- 판다스 Aggregation 함수와 Gropy by 수행
- 판다스 결손 데이터 처리하기
- 판다스 람다식 적용하여 데이터 가공하기
- 파이썬 기반의 머신러닝과 생태계 이해 Summary
Section 2. 사이킷런으로 시작하는 머신러닝
- 사이킷런 소개와 첫번째 머신러닝 애플리케이션 만들어보기 - 붓꽃(Iris) 품종 예측
- 사이킷런의 기반 프레임 워크 익히기 - 주요 API/모듈 및 내장 예제 데이터 세트 소개
- 학습과 데스트 데이터 세트의 분리
- 교차검증 - K-Fold와 Stratified K-Fold
- 교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV
- 데이터 전처리 - 인코딩과 스케일링 - 01
- 데이터 전처리 - 인코딩과 스케일링 - 02
- 사이킷런으로 수행되는 타이타닉 생존자 예측
Section 3. 평가(Evaluation)
- 분류(Classification) 성능 평가지표 개요와 정확도(Accuracy) 소개
- 오차행렬(Confusion Matrix), 정밀도(Precision), 재현율(Recall) 소개
Section 4. 분류(Classification)
Section 5. 회귀(Regression)
Section 6. 차원 축소(Dimension Reduction)
Section 7. 군집화(Clustering)
Section 8. 텍스트 분석
Section 9. 추천(Recommendation)