-2
我有一个大的文本文件(超过10 GB)逆转置数据是这样的:摆动大的文本文件
id name info group count
1 a1 aa1 g1 3
1 a1 aa1 g2 6
1 a1 aa1 g3 1
2 a2 aa2 g1 5
2 a2 aa2 g2 18
3 a3 aa3 g2 7
3 a3 aa3 g4 2
而且我想获得这样一个新的文件:
id name info g1 g2 g3 g4
1 a1 aa1 3 6 1 0
2 a2 aa2 5 18 0 0
3 a3 aa3 0 7 0 2
同样在我的数据中,有超过100个可能的组,我不知道确切的数字。
任何想法如何解决这个问题?
请更具体地说明您遇到的问题。你试过什么了? – fuesika 2014-09-24 14:35:13
ids是否已经排序,就像你介绍它一样? – Korem 2014-09-24 14:44:42
@pyStarter我在Wolfram Mathemtica中做过,但它需要太多时间 - 比如每1 GB 1.5小时。我认为python/perl/rubi必须更快,但我对这种语言不是很熟悉。我知道Python中的一些基础知识,至今我还没有运气。 – matt525252 2014-09-24 14:52:14