0

在这里我是初学者,我想为我的生活,了解了有和我一样同样的问题后流动这一个叠层.. Logistic Regression:Unknown label type: 'continuous'Python的ValueError异常:未知的标签类型:“连续”

这是我下面的机器学习对码,并且外壳输出的是给我ValueError异常:未知的标签类型:“连续”

我想我明白,我“传递花车,其预计分类值作为目标分类vector。如果将它转换为int,它将被接受为输入(尽管如果这是正确的做法,这是值得怀疑的)。最好通过使用sc来转换你的训练分数ikit的labelEncoder函数“

有人可以给我一个关于如何将scikit的labelEncoder函数并入我的代码的提示吗?这是否在声明分类符X & y之前执行?无论我在做什么,我都在做错事。谢谢

import numpy as np 
from sklearn import preprocessing, cross_validation, neighbors, utils 
import pandas as pd 

df = pd.read_csv('C:\\Users\\bbartling\\Documents\\Python\\WB    
Data\\WB_RTU6data.csv', index_col='Date', parse_dates=True) 

print(df.head()) 
print(df.tail()) 
print(df.shape) 
print(df.columns) 
print(df.info()) 
print(df.describe()) 


X = np.array(df.drop(['VAV6znt'],1)) 
df.dropna(inplace=True) 

y = np.array(df['VAV6znt']) 


accuracies = [] 

X_train, X_test, y_train, y_test =    
cross_validation.train_test_split(X,y,test_size=0.50) 

clf = neighbors.KNeighborsClassifier(n_neighbors=50) 
clf.fit(X_train, y_train) 
accuracy = clf.score(X_test, y_test) 

print(accuracy) 

enter image description here enter image description here

回答

1

由于您VAV6znt列是浮动的,这意味着你正在试图估计从数据的数值。这使它成为一个回归问题,并且您正在使用KNeighborsClassifier这是一个分类估算器。

尝试使用KNeighborsRegressor或任何其他名称中含有Regressor的估算器。

将它们转换为int可以工作,但不会给出好的结果,因为这意味着您的数据中包含许多类,因为它们是唯一的整数,这显然是错误的。

+0

感谢您的回应,你能告诉我我的代码在哪里转换为整数?我不太明白这一点,我想尽量避免这种情况......我有一种感觉,我所有的工作都将是这种类型的'浮动'型数据..任何帮助都非常感谢,我也试图找到所有Sci kit学习“Regressor”类型估计器 – HenryHub

+1

@HenryHub你在你的问题中提到“如果你将它转换为int,它将被接受为输入”。无论如何,你应该首先了解分类和回归任务。无论如何,在此页面上搜索Regressor:http://scikit-learn.org/stable/modules/classes.html#api-reference –

+1

这工作非常好,谢谢你的提示。我不得不在分类和回归任务之间做一些研究。 – HenryHub

相关问题