Untitled
unknown
plain_text
2 years ago
956 B
4
Indexable
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score, classification_report from sklearn.preprocessing import LabelEncoder label_encoder = LabelEncoder() # Đọc dữ liệu từ file data = pd.read_csv('Z:\\nDP\\breast-cancer-wisconsin.data') data.head() print("Lấy liệu cho cột Y (cột nhãn)") # y = data.iloc[:, -1] # X = data.iloc[:, 1:10] y = data.iloc[:, -1] print(y) y = data.iloc[:, 0] print(y) # print("Cột nhãn cuối cùng : ", y1) # print("Cột nhãn đầu tiên : ", y2) print("Lấy cho X (bỏ cột nhẫn và cột ID)") X = data.iloc[:, 1:10] print(X) N = len(data.iloc[0, :]) X = data.iloc[:, 0:N-1] print(N) print(X) # In ra số lượng mẫu và số lượng đặc trưng print("Số lượng mẫu:", len(X)) print("Số lượng đặc trưng:", X.shape[1])
Editor is loading...
Leave a Comment