목록실습 (4)
공부하자
분류 모형 모델링해야 함. - train data, test data 분리 df.reset_index(drop = True, inplace = True) # 이상치 행 제거 후 남은 df의 index reset X, y = df.iloc[:, :-1], df.iloc[:, -1] # feature와 target을 나눠준다. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25) # train, test data 분리 분류 모형 종류 여러 개 중 뭘 선택해야 하는걸까 베이지안 통계에 대해 먼저 간략하게 공부하고 오겠음

필요한 라이브러리 임포트 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import sklearn.datasets load_list = list(filter(lambda x: 'load_' in x, dir(sklearn.datasets))) # dataset 리스트 확인하고 로드하기 from sklearn.datasets import * boston = load_boston() breast = load_breast_cancer() diabetes = load_diabetes() digits = load_digits() iris = load_iris() linnerud = load_li..
boston 데이터셋은 찾아보니 보통 sklearn의 선형회귀 모델로 예측하는 듯 import sklearn from sklearn.linear_model import LinearRegression help(LinearRegression) ############################################################### ''' myreg = LinearRegression(fit_intercept=True, normalize=False, ...) 이라는 명령으로 class 객체 생성 fit_intercept : 절편을 사용하지 않는다, 즉 데이터가 중심에 있다고 가정 normalize : 만악 fit_intercept가 False면(절편을 사용한다면)고려하지 않음. True..

import numpy as np import pandas as pd import tqdm import os import sklearn.datasets load_list = list(filter(lambda x: 'load_' in x, dir(sklearn.datasets))) # lambda x: 'load_' in x => x안에 'load_'라는 문자열이 있으면 True를 반환 # filter(func, iterable) => iterable의 요소들이 func함수를 거쳐서, 그 결과가 True인 것만 반환 load_list ['load_boston', 'load_breast_cancer', 'load_diabetes', 'load_digits', 'load_files', 'load_iris', ..