如何制造和使用朴素贝叶斯分类器与Scikit

我在python下面一本关于机器学习，我只是不明白这个代码：如何制造和使用朴素贝叶斯分类器与Scikit

import numpy as np 
import matplotlib.pyplot as plt 
from sklearn.naive_bayes import GaussianNB 
from sklearn import cross_validation 

from utilities import visualize_classifier 

# Input file containing data 
input_file = 'data_multivar_nb.txt' 

# Load data from input file 
data = np.loadtxt(input_file, delimiter=',') 
X, y = data[:, :-1], data[:, -1] 

# Create Naive Bayes classifier 
classifier = GaussianNB() 

# Train the classifier 
classifier.fit(X, y) 

# Predict the values for training data 
y_pred = classifier.predict(X) 

# Compute accuracy 
accuracy = 100.0 * (y == y_pred).sum()/X.shape[0] 
print("Accuracy of Naive Bayes classifier =", round(accuracy, 2), "%")

我只是有几个问题：

data [:,：-1]和data [：，-1]是做什么的？输入文件的形式：

2.18,0.57,0 
4.13,5.12,1 
9.87,1.95,2 
4.02,-0.8,3 
1.18,1.03,0 
4.59,5.74,1

如何计算精度的部分工作？什么是X.shape [0]？最后，我如何使用分类器来预测新值的y？

来源

2017-09-16 Primusa

当您为numpy数组建立索引时，您可以使用类似于列表的方括号。

my_list[-1]返回列表中的最后一项。

例如。

my_list = [1, 2, 3, 4] 
my_list[-1] 
4

如果您熟悉列表索引，那么您将知道切片是什么。

my_list[:-1]返回从开始到最后一个的所有项目。

my_list[:-1] 
[1, 2, 3]

在您的代码中，data[:, :-1]只是使用二维切片进行索引。查找有关numpy数组的文档以获取更多信息。了解ndarrays是使用sklearn的先决条件。

来源

2017-09-16 01:33:33 Bill

如何制造和使用朴素贝叶斯分类器与Scikit

回答

相关问题