2016-01-14 37 views
1

我想总结一下每行的整数。我有一个数据文件,用于提取信息。总结壳数

我使用此命令提取第10列中具有大于0.25的值的第7个信息。我希望得到总数超过0.25的整数。但我发现了这是我现在越来越多0.25

awk -F"\t" 'NR>1{split($10,a,":"); count10[a[7]]++} END {for (i in count10) if (i>0.25) print i, count10[i]}' mygene.vcf 

样本输出整数列表:

0.689 7 
0.648 9 
0.607 83 
0.279 26 

什么我需要:

125 

样本数据(第10栏)

1/1:27:0,27:0,37:0:0,0.741:1.0:0:98:0,59.0 
1/0:26:15,11:35,37:0:0.733,0.727:0.423:0:28:56.9,60.0 
1/1:55:0,55:0,38:0:0,0.527:1.0:0:183:0,59.6 
1/0:49:26,23:36,36:0:0.615,0.739:0.469:0:47:60.0,58.5 
+2

您能否提供一些样本数据? –

回答

1

你基本上已经拥有了它。不要为for循环的每次迭代打印一张图,而要累积并打印:

awk -F"\t" 'NR>1 {split($10,a,":"); 
        count10[a[7]]++} 
      END {for (i in count10) 
        if (i>0.25) 
         sum += count10[i]; 
        print sum }' mygene.vcf