Untitled

import pandas as pd
msg = pd.read_csv(&#39;document1.csv&#39;, names=[&#39;message&#39;, &#39;label&#39;])
print(&quot;Total Instances of Dataset: &quot;, msg.shape[0])
msg[&#39;labelnum&#39;] = msg.label.map({&#39;pos&#39;: 1, &#39;neg&#39;: 0})
X = msg.message
y = msg.labelnum
from sklearn.model_selection import train_test_split
Xtrain, Xtest, ytrain, ytest = train_test_split(X, y)
from sklearn.feature_extraction.text import CountVectorizer
count_v = CountVectorizer()
Xtrain_dm = count_v.fit_transform(Xtrain)
Xtest_dm = count_v.transform(Xtest)
df = pd.DataFrame(Xtrain_dm.toarray(),columns=count_v.get_feature_names())
print(df[0:5])
from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB()
clf.fit(Xtrain_dm, ytrain)
pred = clf.predict(Xtest_dm)

for doc, p in zip(Xtrain, pred):
p = &#39;pos&#39; if p == 1 else &#39;neg&#39;
print(&quot;%s -&gt; %s&quot; % (doc, p))
from sklearn.metrics import accuracy_score, confusion_matrix, precision_score, recall_score
print(&#39;Accuracy Metrics: \n&#39;)
print(&#39;Accuracy: &#39;, accuracy_score(ytest, pred))
print(&#39;Recall: &#39;, recall_score(ytest, pred))
print(&#39;Precision: &#39;, precision_score(ytest, pred))
print(&#39;Confusion Matrix: \n&#39;, confusion_matrix(ytest, pred))
Editor is loading...