Untitled

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()

# Đọc dữ liệu từ file
data = pd.read_csv('Z:\\nDP\\breast-cancer-wisconsin.data')
data.head()


print("Lấy liệu cho cột Y (cột nhãn)")
# y = data.iloc[:, -1]
# X = data.iloc[:, 1:10]

y = data.iloc[:, -1]
print(y)

y = data.iloc[:, 0]
print(y)

# print("Cột nhãn cuối cùng : ", y1)
# print("Cột nhãn đầu tiên : ", y2)

print("Lấy cho X (bỏ cột nhẫn và cột ID)")

X = data.iloc[:, 1:10]
print(X)

N = len(data.iloc[0, :])
X = data.iloc[:, 0:N-1]
print(N)
print(X)

# In ra số lượng mẫu và số lượng đặc trưng
print("Số lượng mẫu:", len(X))
print("Số lượng đặc trưng:", X.shape[1])
Editor is loading...