我有一系列我想要合并的数据帧,按顺序累加特定元素。对于背景,这些是用于基因组序列数据的单独分区文件,其参考沿着比对的基因区域(将其想象为字符串的部分)。我将序列对齐合并在一起,因此需要将分区文件合并在一起,同时保留分区相对位置。尽可能地将这一点尽可能地适应个别分区文件的任何数目和长度是很好的。R按顺序合并元素合并数据帧 - 棘手。
的合并和总结需要工作是这样的:
- 第二列元素是前行的第三列元素加一。
- 对于第一个数据帧,第三列:第一个元素等于n,第二个元素等于2n,第三个元素是3n,依此类推。
- 在新合并的数据帧中,第三列的第一个元素将成为其值(x)加上前一个数据帧(x +?n)中第三列的最后一个元素。然后将x添加到每行的x +?n,直到数据帧的结尾或新的一个合并为止。
一个简单的例子会更好地解释。
这里是1区的数据帧:
V1 V2 V3
Region_1_Partition_1 1 500
Region_1_Partition_2 501 1000
Region_1_Partition_3 1001 1500
这里是区域2:
V1 V2 V3
Region_2_Partition_1 1 200
Region_2_Partition_2 201 400
Region_2_Partition_3 401 600
最终分区文件需要是这样的:
V1 V2 V3
Region_1_Partition_1 1 500
Region_1_Partition_2 501 1000
Region_1_Partition_3 1001 1500
Region_2_Partition_1 1501 1700
Region_2_Partition_2 1701 1900
Region_2_Partition_3 1901 2001
我猜猜到目前为止,还有很多完美的解决方案无法解决!
感谢 Ç
只是尝试这样做,效果很好,然后再重新订购。你有扩大的建议 - 说我非常为.csv 20+个别分区上的文件? –
我已经编辑了答案,包括我试图解决这个问题 – HarlandMason