Untitled
unknown
plain_text
2 years ago
956 B
6
Indexable
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
# Đọc dữ liệu từ file
data = pd.read_csv('Z:\\nDP\\breast-cancer-wisconsin.data')
data.head()
print("Lấy liệu cho cột Y (cột nhãn)")
# y = data.iloc[:, -1]
# X = data.iloc[:, 1:10]
y = data.iloc[:, -1]
print(y)
y = data.iloc[:, 0]
print(y)
# print("Cột nhãn cuối cùng : ", y1)
# print("Cột nhãn đầu tiên : ", y2)
print("Lấy cho X (bỏ cột nhẫn và cột ID)")
X = data.iloc[:, 1:10]
print(X)
N = len(data.iloc[0, :])
X = data.iloc[:, 0:N-1]
print(N)
print(X)
# In ra số lượng mẫu và số lượng đặc trưng
print("Số lượng mẫu:", len(X))
print("Số lượng đặc trưng:", X.shape[1])Editor is loading...
Leave a Comment