所以这个问题困扰着我,我还有一百万个其他项目要去,所以我希望能够清楚这一点。到目前为止,我还没有找到答案。看起来很简单。我用:
awk '$1' merged_counts.txt |sort|uniq -d|wc
并得到了216行。但是,这个数字是不正确的。如果我用
more merged_counts.txt|cut -f 1|sort|uniq -d|wc
我得到271行,这是正确的。如果我使用
awk '{print $1}' merged_counts.txt |sort|uniq -d|wc
我也得到271行,但是,那么我也失去了其余的领域。我无法弄清楚为什么它看起来像是一件基本的事情。感谢您的任何帮助/建议。当然,我必须俯视一些东西。文件的
实施例:
B3GALT1 72 128 65 124 87 118 102 117 38 106 87 115 27 20 89 30
AMY1A 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
PSENEN 654 459 648 462 508 399 537 532 696 460 625 473 621 322 633 434
基因“AMY1A”是在两个DNA链注释所以它在我的文件中出现两次的那些基因中的一个。
顺便说一句,我的问题是为什么我得到216和271.我知道使用awk打印将摆脱其余的领域。谢谢! – user2937872
您正在使用'more'(一个交互式程序),您应该使用'cat',或者甚至更好'cut -f 1
chepner
我的坏习惯。我脑子里的某些东西只允许我使用猫,如果我真的要连接某些东西的话。 – user2937872