[ML/Python] 분류 분석 (DecisionTreeClassifier) (matplotlib, sklearn, pandas)
·
AI
use skill: matplotlib, sklearn, pandas 분류 분석이란?- 조건식을 이용하여 데이터를 분할해가면서 정답을 찾아가는 과정- 불순도 - 종속 변수의 혼합도 - 분류 : 지니 지수, 엔트로피, 로그 손실 - 회귀 : 분산 감소, MSE, MAE * DecisionTreeClassifier (분류)- 라이브러리 로드import matplotlib.pyplot as pltfrom sklearn.tree import DecisionTreeClassifier, plot_treeimport pandas as pd - iris 데이터 로드 head를 확인해보니 해당하는 품종 그대로 있다.위 데이터로 작업 진행 # 분류 모델에서 사용 (모델에 넣어서 tree구조 어떻게 나..
[ML/Python] 산점도 그래프 및 회귀 분석 (pandas, matplotlib, seaborn, numpy, sklearn)
·
AI
기존 가지고 있던 boston.csv 엑셀 파일로 산점도 그래프 및 회귀 분석 실습을 진행해 보았다.skill: pandas, matplotlib, seaborn, numpy, sklearn## 회귀 분석- 특정한 값을 찾아내는 과정 ( 기기가 스스로 데이터간의 규칙을 찾아내는 과정 )- 평가 지표 - MAE - 실젯값과 예측값의 차이에 절대값으로 평균을 구한 값 - MSE - 실젯값과 예측값의 차이를 제곱한 뒤 평균을 구한 값 - RMSE - MSE에 루트를 씌운 값 - MSLE - MSE 값에 로그를 적용한 값 - MAPE - MAE를 퍼센트로 표시 - R2 Score - 가장 대중적으로 사용..
머신 러닝 기초 이론 정리
·
AI
머신 러닝의 기본 과정데이터의 수집 -> 학습할 자료를 수집 (DataBase, Open API, 크롤링)데이터 전처리 -> 결측치, 이상치, 정규화등모델 선택 -> 회귀, 분류, 트리, 신경망 등 데이터에 맞게 선택훈련 -> Train 데이터를 이용한 학습 ( 기기가 스스로 규칙 발견 )평가 -> 새로운 데이터를 이용하여 성능을 검증예측 -> 실제 상황에서 적용 머신 러닝의 종류지도 학습 : 정답이 있는 데이터를 학습, 회귀·분류비지도 학습 : 정답이 없는 데이터에서 패턴을 찾음, 군집화 · 이상치 감지 · 차원 축소강화 학습 : 보상을 통해 행동을 학습, 로봇 제어 · 게임 플레이 회귀 분석의 성능 평가 지표MAE- 실제의 값과 예측 값의 차이를 절댓값으로 변환하여 평균을 구한 값- 에러의 크기가 그..