scikit-learn

0热度

1回答

紧随着scikit-learn文档，我正在试图安装一个虚拟classif9er。但是，在运行时会引发错误值。这是意想不到的，因为之前我使用的是相同的数据：X = vector_data（一个稀疏矩阵），y = vector_target（一个int列表）与网格搜索cv拟合，没有这样的错误。因此它必须引入train_test_split。为什么在我的代码中发生这种情况，而不是文档，应该采取哪些预

1热度

1回答

传递一个额外的参数来GenericUnivariateSelect没有范围的招数

编辑：下面是完整的回溯，如果我申请了make_scorer解决办法的答案建议... `File "________python/anaconda-2.7.11-64/lib/python2.7/site-packages/spyder/utils/site/sitecustomize.py", line 880, in runfile execfile(filename, namesp

1热度

1回答

模块“sklearn”有没有属性“cross_validation”

我想我的数据集分成训练和测试数据集，但我得到这个错误： X_train,X_test,Y_train,Y_test = sklearn.cross_validation.train_test_split(X,df1['ENTRIESn_hourly']) AttributeError Traceback (most recent call last) <ipython-input

3热度

1回答

sklearn转换操作的数据是什么？

我在sklearn中编写了一组自定义转换，以清理管道中的数据。每个自定义转换都需要两个Pandas DataFrame作为fit和transform的参数，transform也返回两个DataFrame（请参见下面的示例）。当流水线中只有一个Transformer时，此工作正常：DataFrames in和DataFrames out。然而，当两个Rransformers在管道结合时，这样的：

-1热度

2回答

查找支持向量机分类的最重要功能

我正在训练二元分类器使用python和流行的scikit-learn模块的SVM类。在训练后，我使用predict方法进行分类，如sci-kit's SVC documentation所示。我想知道更多关于我的样本特征对经过训练的decision_function（支持向量）所产生的分类的重要性。欢迎使用这种模型进行预测时评估特征重要性的任何策略。谢谢！ Andre

0热度

1回答

k表示使用python的结构化数据 - 多于一列

如何在结构化数据中的多列上做k？在下面1列（名称）及其所完成的例子 tfidf_matrix = tfidf_vectorizer.fit_transform（df_new [“名”]）这里仅使用名字，但说我们想用的名字和国家，我是否应该将国家添加到同一专栏如下？ df_new['name'] = df_new['name'] + " " + df_new['country'] tfidf_

0热度

1回答

ValueError：未知标签类型：'unknown' - 标签是数字

我正在为二元分类问题构建一个随机森林分类器。我的标签都是数字。 print labels.unique() [1 0] print type(labels) <class 'pandas.core.series.Series'> print labels.shape (3000,) 但是，当我在拟合模型Gridsearchcv pipeline = Pipeline(ste

0热度

2回答

如何指定决策树中的拆分？

我正在尝试使用scikit-learn提供的函数来训练评估棒球运动员的决策树分类器。但是，我想根据我所知道的专家认为的方式（这些需要被整合）来事先“预先指定”或“强制”某些分裂。例如，我想强制基于打击平均> .300的分割。一个相关的问题是 - 可以“预加载”一个先前训练过的决策树模型，而只是在随后的训练中“更新”它？或者decisio树分类器每次运行时都需要重新学习所有规则？我试图在这里做的比

1热度

2回答

超参数在分类表决

所以，我有一个分类，它看起来像 clf = VotingClassifier(estimators=[ ('nn', MLPClassifier()), ('gboost', GradientBoostingClassifier()), ('lr', LogisticRegression()), ], voting='soft') 而且我想基本

2热度

2回答

在Scikit中找到混合度多项式学习支持向量回归

据我所知，在Scikit学习中支持向量回归需要一个度数的整数。但是，在我看来，好像是不考虑低阶多项式。运行下面的例子： import numpy from sklearn.svm import SVR X = np.sort(5 * np.random.rand(40, 1), axis=0) Y=(2*X-.75*X**2).ravel() Y[::5] += 3 * (0.5 - n