我想打印匹配的搜索模式,然后计算平均行。最好将是一个expample:在awk中打印搜索模式
输入文件:
chr17 41275978 41276294 BRCA1_ex02_01 278
chr17 41275978 41276294 BRCA1_ex02_01 279
chr17 41275978 41276294 BRCA1_ex02_01 280
chr17 41275978 41276294 BRCA1_ex02_02 281
chr17 41275978 41276294 BRCA1_ex02_02 282
chr17 41275978 41276294 BRCA1_ex02_03 283
chr17 41275978 41276294 BRCA1_ex02_03 284
chr17 41275978 41276294 BRCA1_ex02_03 285
chr17 41275978 41276294 BRCA1_ex02_04 286
chr17 41275978 41276294 BRCA1_ex02_04 287
chr17 41275978 41276294 BRCA1_ex02_04 288
我在bash循环(例如)一样的第四列瓦纳提取物:
OUTPUT1:
chr17 41275978 41276294 BRCA1_ex02_01 278
chr17 41275978 41276294 BRCA1_ex02_01 279
chr17 41275978 41276294 BRCA1_ex02_01 280
OUTPUT2 :
chr17 41275978 41276294 BRCA1_ex02_02 281
chr17 41275978 41276294 BRCA1_ex02_02 282
OUTPUT3:
chr17 41275978 41276294 BRCA1_ex02_03 283
chr17 41275978 41276294 BRCA1_ex02_03 284
chr17 41275978 41276294 BRCA1_ex02_03 285
的等等。然后计算平均为第五列是很容易的:
AWK 'END {总和+ = $ 5} {打印NR /总和}' in_file.txt
在我的情况下,有数千行BRCA1_exXX_XX - 所以任何想法热分裂它?
Paul。
这假设条目总是按顺序排列的。 –
Wau它看起来可以工作:-)谢谢!有可能解释吗?我可以添加到第三列标准偏差值吗? – Geroge
@EtanReisner是的,它假定条目按第4列排序,如给定数据中所示。 – ooga