scikit-learn

    0热度

    1回答

    紧随着scikit-learn文档,我正在试图安装一个虚拟classif9er。但是,在运行时会引发错误值。这是意想不到的,因为之前我使用的是相同的数据:X = vector_data(一个稀疏矩阵),y = vector_target(一个int列表)与网格搜索cv拟合,没有这样的错误。 因此它必须引入train_test_split。 为什么在我的代码中发生这种情况,而不是文档,应该采取哪些预

    1热度

    1回答

    编辑: 下面是完整的回溯,如果我申请了make_scorer解决办法的答案建议... `File "________python/anaconda-2.7.11-64/lib/python2.7/site-packages/spyder/utils/site/sitecustomize.py", line 880, in runfile execfile(filename, namesp

    1热度

    1回答

    我想我的数据集分成训练和测试数据集,但我得到这个错误: X_train,X_test,Y_train,Y_test = sklearn.cross_validation.train_test_split(X,df1['ENTRIESn_hourly']) AttributeError Traceback (most recent call last) <ipython-input

    3热度

    1回答

    我在sklearn中编写了一组自定义转换,以清理管道中的数据。每个自定义转换都需要两个Pandas DataFrame作为fit和transform的参数,transform也返回两个DataFrame(请参见下面的示例)。当流水线中只有一个Transformer时,此工作正常:DataFrames in和DataFrames out。 然而,当两个Rransformers在管道结合时,这样的:

    -1热度

    2回答

    我正在训练二元分类器使用python和流行的scikit-learn模块的SVM类。在训练后,我使用predict方法进行分类,如sci-kit's SVC documentation所示。 我想知道更多关于我的样本特征对经过训练的decision_function(支持向量)所产生的分类的重要性。欢迎使用这种模型进行预测时评估特征重要性的任何策略。 谢谢! Andre

    0热度

    1回答

    如何在结构化数据中的多列上做k? 在下面1列(名称)及其所完成的例子 tfidf_matrix = tfidf_vectorizer.fit_transform(df_new [“名”]) 这里仅使用名字,但说我们想用的名字和国家,我是否应该将国家添加到同一专栏如下? df_new['name'] = df_new['name'] + " " + df_new['country'] tfidf_

    0热度

    1回答

    我正在为二元分类问题构建一个随机森林分类器。我的标签都是数字。 print labels.unique() [1 0] print type(labels) <class 'pandas.core.series.Series'> print labels.shape (3000,) 但是,当我在拟合模型Gridsearchcv pipeline = Pipeline(ste

    0热度

    2回答

    我正在尝试使用scikit-learn提供的函数来训练评估棒球运动员的决策树分类器。但是,我想根据我所知道的专家认为的方式(这些需要被整合)来事先“预先指定”或“强制”某些分裂。例如,我想强制基于打击平均> .300的分割。 一个相关的问题是 - 可以“预加载”一个先前训练过的决策树模型,而只是在随后的训练中“更新”它?或者decisio树分类器每次运行时都需要重新学习所有规则?我试图在这里做的比

    1热度

    2回答

    所以,我有一个分类,它看起来像 clf = VotingClassifier(estimators=[ ('nn', MLPClassifier()), ('gboost', GradientBoostingClassifier()), ('lr', LogisticRegression()), ], voting='soft') 而且我想基本

    2热度

    2回答

    据我所知,在Scikit学习中支持向量回归需要一个度数的整数。但是,在我看来,好像是不考虑低阶多项式。 运行下面的例子: import numpy from sklearn.svm import SVR X = np.sort(5 * np.random.rand(40, 1), axis=0) Y=(2*X-.75*X**2).ravel() Y[::5] += 3 * (0.5 - n