feature-selection

    0热度

    1回答

    我想使用遗传算法使用插入特征选择,得到错误消息。我的代码如下所示: set.seed(10) trainIndex <- createDataPartition(iris$Species, p = .5, list = FALSE, times = 1) trainData <- iris[trainIndex,-c(1,2)] testData <- iris[-trainIndex,-c

    1热度

    1回答

    我想计算的T统计量的R中特征选择与循环。数据有155列,因变量是二元的(诱变剂 - 非突变型)。我想为每列分配一个t-stat。问题是我无法弄清楚我怎么写它。 这里是我试图R中执行公式: 此外,我写了一个代码,但我不知道它,它只是为第一列。我需要将它写入所有列的for循环。 abs(diff(tapply(train_df[,1], train_df$Activity, mean)))/sqrt(

    0热度

    1回答

    我的问题是在一个示例.wav文件中取自不同帧的所有功能的均值。我正在尝试属于最新OpenEar框架的“chroma_fft.conf”文件中的cFunctionals。为了得到最好的解释,我正在编写这些我在“chroma_fft.conf”中编写的基本代码,如下所示; [componentInstances:cComponentManager] instance[functL1].type =

    0热度

    1回答

    我想用SelectKBest选择前K功能和运行GaussianNB: selection = SelectKBest(mutual_info_classif, k=300) data_transformed = selection.fit_transform(data, labels) new_data_transformed = selection.transform(new_data)

    1热度

    2回答

    可以将sklearn的RandomForestClassifier的属性feature_importance_给出的可变重要性值解释为百分比?我知道当在分割点使用特定特征时,其所有树木的杂质指数降低的平均值。feature_importance_值的范围是什么?对于具有1000个特征的数据集,如果feature_importance_的取值范围为0〜0.05,大部分特征为0,只有少数表现出轻微增加

    -1热度

    1回答

    让我前言本: 我已经在这个问题上广泛地看着,我已经发现了几个有趣的可能性考虑(如this和this)。我也研究过主成分分析,并且我看到一些消息来源声称这是一个不好的降维方法。但是,我觉得它可能是一个好方法,但我不确定如何实现它。我在这个问题上找到的所有资源都给出了一个很好的解释,但是他们很少提供任何关于实际应用这些方法之一的建议(即如何在R中实际应用方法)。 所以,我的问题是:是否有一个明确的方法

    -1热度

    1回答

    如何在WEKA中执行功能选择后将新数据集保存在其他应用程序中?

    0热度

    1回答

    您好,我使用xgboost中的feature_importance绘制了一个图。但是,图表返回“f值”。我不知道图中代表哪个特征。我听说如何解决这个问题的一种方法是将我的数据框中的要素索引映射到feature_importance“f-值”的索引并手动选择列。我如何去做这件事?此外,如果在这样做的另一种方式,帮助将真正意识到: 这里是我下面的代码: feature_importance = pd.

    3热度

    1回答

    我正在做PCA,我对哪些原始特征最重要感兴趣。让我来说明这一个例子: import numpy as np from sklearn.decomposition import PCA X = np.array([[1,-1, -1,-1], [1,-2, -1,-1], [1,-3, -2,-1], [1,1, 1,-1], [1,2,1,-1], [1,3, 2,-0.5]]) print

    4热度

    4回答

    xgboost的plotting API状态: xgboost.plot_importance(booster, ax=None, height=0.2, xlim=None, ylim=None, title='Feature importance', xlabel='F score', ylabel='Features', importance_type='weight', max_num_f