我使用巨大的文件(基因表达文件);每列代表一个样本,每行代表一个特异性探针的表达(每个样本使用相同的探针)。例如,如何用awk进行多次传递?
的Sample1
PROBE1
PROBE2
...
ProbeN
我可以有43000+探针和> 50个样品。尽管我可以在技术上使用二维数组,但是一旦我获得了更多样本的文件,这将不再有效。因此,我正在考虑对同一文件进行多次传递(每次都是新列),对每列应用算法,将结果打印在单独的文件中。
我试过一个倒带功能重新开始,但程序不遵循相同的说明。
for(i = ARGC; i > ARGIND; i--)
ARGV[i] = ARGV[i-1]
ARGC++
ARGV[ARGIND+1] = FILENAME
nextfile
你有什么想法吗?
谢谢!
如果您可以发布一些示例数据以及期望的输出。 –
并需要两个样本数据作为输入文件。 – BMW