我正在寻找一种方法将数据帧拆分成相同大小(基本上每个组中的行数基本相同)的组,其组的平均数几乎相等。将数据拆分成等义的组
User Data
1 5.0
2 4.5
3 3.5
4 6.0
5 7.0
6 6.5
7 5.5
8 6.2
9 5.7
10 5.9
这非常类似于this request然而,这仅将数据分成2组。
我的实际数据集包含75-150行的任何地方,我需要将它分成5-10组相同均值和相当大小的组。
我在Google上研究过Stack Exchange在过去的几天里,我只是没有太多的运气。任何指导都会很棒。
在此先感谢!
更多细节:
也许我需要提供一些更多的细节,下面我已经包含了真正的数据集。我们是一家运输公司,这个数据集有Driver ID,Miles,Gallons提供。我一直在做的是将数据读入R,添加和MPG列,像这样:
data <- read.csv('filename')
data$MPG <- data$Miles/data$Gallons
然后我尝试以下两个提供答案。阿伦的想法给了我几乎相同的团体规模(每组9名成员,10组),但平均数的变化很大,从6.615 - 7.093,这对我来说是一个变化太大的开始。托马斯的想法变得稍微有些紧张,但团队规模与6-13名成员不同。
我们要做的是改善车队MPG,并且我们将以团队为基础的比赛来完成这个任务,所以我需要随机地将车队随同他们一起从相同的团队MPG开始。
也许这有助于并可以引导我们走向正确的方向?我试图用我的编程语言来做这件事,但它每次都会锁定计算机,所以我认为R可能能够更好地处理数据。
再次感谢!
我认为这与[**分区问题**](http://en.wikipedia.org/wiki/Partition_problem)有关,以防您感兴趣。 – Arun
感谢您的回复,您向我提供了一个可用于我生成的数据集的解决方案。 – dcmoody