2014-09-22 47 views
-3

我对R/Rstudio相当陌生,而且我仍然在学习如何执行某些操作。 我有以下数据集。对于列,我有操作区域,元素类型(CA,OBU),子元素和净收入。 目前数据非常庞大(50 000行),我想通过元素,子元素和NR得到操作区域的总结。 例子R数据子集成重构

Operating Region Element Sub-Element NR 
Asia  CA  CA123 50 000 
America OBU  EFK456 35 000 

有人请指导我如何做到这一点? 任何相关的读物/例子将不胜感激。

+0

你想得到'Operating,Region,Element,Sub-Element'的“NR”摘要统计吗? – akrun 2014-09-22 07:00:09

+0

检查'摘要' – 2014-09-22 07:05:58

+0

或使用'库(doBy); summaryBy' – akrun 2014-09-22 07:06:58

回答

1

使用下面的数据返回数据框对象“数据”,您可以使用dplyr包以多种不同方式组织结果。这里有一个例子:

data <- data.frame("OperatingRegion" = c("Asia", "America"), "Region" = c("CA", "OBU"), "Element" = c("CA123", "EFK456"), "SubElement" = c(50000, 35000)) 

require(dplyr) 
results <- data %.% 
    group_by(OperatingRegion) %.% 
    summarise(SubE = sum(SubElement, na.rm = TRUE)) 

Source: local data frame [2 x 2] 

    OperatingRegion SubE 
1   America 35000 
2   Asia 50000 

加载包后,您提供dplyr数据帧,然后使用特殊运算符%%或%>%,GROUP_BY你想要的任何单个或多个变量。然后,拨打summarise来创建总和,中位数,平均值或任何您想要的计算。