r-factor

    3热度

    2回答

    这是我从互联网加载的数据帧的一部分使用readHTMLtable: head(tt,59) year sport event athlete_id medal 1 1896 Track & Field 100m Men BURKETOM01 GOLD 2 1896 Track & Field 100m Men HOFMAFRI01 SILVER

    0热度

    1回答

    是否有比以下更智能的方式对因数级别的数据框列进行简单的算术运算? data <- runif(100,0,1) df <- data.frame(x = data, class = cut(data, breaks = c(0,0.5,1), labels = c("low", "high"))) df$x2 <- ifelse(df$class == "high", df$x

    1热度

    1回答

    我有一个包含多个列的数据集。其中许多列包含超过32个因子,因此要运行随机森林(例如),我想根据它们的频率计数来替换列中的值。 一列的内容是这样的: $ country : Factor w/ 92 levels "China","India","USA",..: 30 39 39 20 89 30 16 21 30 30 ... 我想要做的是只保留前N(N为5和20之间的值

    1热度

    1回答

    考虑这个数据帧: df <- data.frame(vars=c(rnorm(3),rnorm(3,2,1), rnorm(3,1,1)), names=c("a","b","c","a","d","b","c","a","f"), groups=c(rep("x",3),rep("y",3),rep("z",3))) 我与ggplot绘制这样的: ggplot(d

    3热度

    3回答

    我在R中工作,其中包含一个由数字变量和字符变量组成的数据框。我的数据框DF看起来像这样(我加dput版本中最后部分): a1 b1 1 a 10.15 2 a 25.10 3 a 32.40 4 a 56.70 5 a 89.02 6 b 90.50 7 b 78.53 8 b 98.12 9 b 34.30 10 b 99.75 在DF变量a1是一组变量,b1是数值变量。

    1热度

    1回答

    我在这里看到了很多关于将因子转换为数字变量的问题,但似乎没有解决我所要做的事情。 我想在包含现有因子的数字表示的数据框中创建一个新列。我试过了: df$num = as.numeric(df$factor) 转换因子,但没有根据需要对它们进行排序。我怎样才能明确定义每个因子的数值?沿着线的东西: df$num = ("1" if factor == "GB", "2" if factor ==

    0热度

    2回答

    我遇到了一个小问题,模拟了掷骰子。基本上这样做是为了熟悉循环及其输出。 意向是模拟两个骰子的掷如下:发生 R = 100 d6 = c(1:6) d = 60 DICE = NULL for (i in 1:R) { i <- as.factor((sample(d6, size=d, replace = T)) + (sample(d6, size=d, replace = T)))

    2热度

    1回答

    我正在创建一个shiny app,其中用户将上载包含多个变量的.csv文件。使用dplyr,我会select前四个变量,如下所示,并将它们从长格式转换。 DATA df <- read.table(text = c(" Customer Rate Factor Power W1 6 TK1 5 W2 3 TK1 0 W3 1 TK1 0 W4 2 TK1 0 W5 4 TK1 0 W

    0热度

    3回答

    我很努力地找到R因子对象中存在的数字(整数)值与其级别标签之间的连接。我知道如何定义关卡和标签。但是让我们假设我得到一个陌生数据集,其中我会找到几个因素(这里:性别&颜色): test <- data.frame( factor(c(1,2,1,1,2,2,1), levels= c(1,2), labels = c("female",

    1热度

    1回答

    我有一个称为“国籍”的向量,表示受访者在我的数据框(df)中的国籍。然而,问题在于它现在是一个从1到193的整数向量。我有另一个称为“标签”的行标签,每个国家标签(即第一列是“阿富汗”,第二个是“阿尔巴尼亚”等)。我想要做的是将“国籍”向量转换为一个因子,并用标签替换其数值。我尝试这样做: df$nationality <- as.factor(df$nationality) labels2 <