r-factor

    0热度

    2回答

    我非常停留在有关汇总分类数据的基本问题上。我的原始数据由UserId,ItemId,CategoryID格式的多个记录组成。对于每个ItemID都有一个固定的CategoryID。对于每个用户ID,都有一个固定的GroupID。每个UserId可以有一个artibrary数量的条目,但每个ItemID只能有一个条目。在我阅读.csv数据的那一刻,我将每列设置为一个因子。 这里是一个玩具数据集: u

    4热度

    1回答

    数据看起来像这样添加一个因素: statenum casenum vnumber pnumber numfatal 1 48 3081 1 1 1 2 48 3080 5 1 1 3 48 3080 4 1 1 4 48 3080 1 1 1 5 48 3080 2 1 1 6 48 3080 3 1 1 7 48 3079 1

    2热度

    1回答

    予有这种数据帧的: df<- data.frame(cluster=c('1','1','2','3','3','3'), class=c('A','B','C','B','B','C')) 我想获得每个簇(1,2,3),其中出现次数最多的类。在平局的情况下,获得信息也是非常好的,例如类的组合(或者如果不可能,只有NA)。 所以对于我的例子,我想有这样的事情作为结果: cluster clas

    2热度

    1回答

    我有一个问题,并希望你们中的一些人可以帮助我。问题是这样的:对于包含长度为n的向量y和具有k个不同级别的因子f的给定数据帧,我想基于f给数据帧分配长度为k的新变量z。 例子: df <- data.frame(y=rnorm(12), f=rep(1:3, length.out=12)) z <- c(-1,0,5) 注意,我真正z已经构建对应于独特的因子水平,这也就是为什么length(z

    13热度

    1回答

    我有一个名为rRna_RDP_taxonomy_phylum文件数据如下: 364 "Firmicutes" 39.31 244 "Proteobacteria" 26.35 218 "Actinobacteria" 23.54 65 "Bacteroidetes" 7.02 22 "Fusobacteria" 2.38 6 "Thermotogae" 0.65 3

    0热度

    1回答

    我创建了一个包含所有分类变量的决策树模型。其中一些分类变量有超过100个可能的值。 这是我的代码: model = rpart(score ~., data = dataset); plot(model) text(model) 的问题是,text(model)注释与值的相应分类变量的长列表的每个分割节点。这些价值观被挤入对方,很难看。我正在寻找text(model)的选项来仅显示变量名称

    1热度

    1回答

    我有以下格式的数据帧和我想横制表表: T1 T2 NN NF FF FF NF FF NN NN NN FF NF NF NF NF FF FF 我可以通过使用表()函数 表中创建一个简单的交叉制表表(T1, T2) 这给了我下面的输出: FF FN NF NN FF 2 0 0 0 FN 0 0 0 0 NF 1 0 2 0 然而因子水平NN默认情况下删除。有没有一

    2热度

    3回答

    行 我有一个数据帧: > x = data.frame(var1 = c(0,0,1,1), var = c(0,1,0,1)) 我想另一列添加到该数据帧是因子,基于所述值集合var1和var2。 factor "00" if both are 0 factor "10" if var1 = 1 and var2 = 0 factor "01" if var1 = 0 and var2 =

    0热度

    1回答

    我需要在R中创建带有data.frame函数的新数据(这个新数据然后与预测函数一起使用)。我有两个因素被纳入新数据,但他们有不同数量的级别。因素SSD有3个级别和因素Year有4个级别。我用下面的命令: newdata <- data.frame( a = rep(mean(Data$a), 100), b = rep(seq(from = min(Data$b),

    10热度

    2回答

    标题说明了一切,我在生成它时订购了一个因子变量,现在我想删除这个订单并将它用作无序因子变量。 另一个问题是,如果我在回归中使用因子变量作为预测因子,如果它是有序的(有序的)或简单的因子变量(分类的),它会对R产生影响吗?