Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

공부하자

실습 - sklearn 데이터셋 : Breast cancer (2) 본문

실습

실습 - sklearn 데이터셋 : Breast cancer (2)

맥뚜원샷 2021. 1. 15. 16:49

분류 모형 모델링해야 함.

 

- train data, test data 분리

df.reset_index(drop = True, inplace = True) # 이상치 행 제거 후 남은 df의 index reset
X, y = df.iloc[:, :-1], df.iloc[:, -1] # feature와 target을 나눠준다.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25) # train, test data 분리

 

분류 모형 종류 여러 개 중 뭘 선택해야 하는걸까

 

베이지안 통계에 대해 먼저 간략하게 공부하고 오겠음