공부하자
실습 - sklearn 데이터셋 : Breast cancer (2) 본문
분류 모형 모델링해야 함.
- train data, test data 분리
df.reset_index(drop = True, inplace = True) # 이상치 행 제거 후 남은 df의 index reset
X, y = df.iloc[:, :-1], df.iloc[:, -1] # feature와 target을 나눠준다.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25) # train, test data 분리
분류 모형 종류 여러 개 중 뭘 선택해야 하는걸까
베이지안 통계에 대해 먼저 간략하게 공부하고 오겠음
'실습' 카테고리의 다른 글
실습 - sklearn 데이터셋 : Breast cancer (1) (0) | 2021.01.15 |
---|---|
실습 - sklearn 데이터셋 : Boston (2) (0) | 2021.01.13 |
실습 - sklearn 데이터셋 : Boston (1) (0) | 2021.01.12 |