我试图使用单独的“标识符文件”(2列1050行)从大制表符分隔的文本文件(18行20600行,'目标文件')中提取行行)。标识符文件包含第二列中需要与目标文件中的标识符匹配的标识符(目标文件中的列1)。目标是找到目标文件中的所有1050个匹配项,并为每个匹配的1050行提取所有18个(标识符+ 17值)值(即,创建一个18x1050文件,其中公共标识符中的第一列)。我试图在没有太多好运的情况下在python中完成此操作。这是我试过的:通过python中的文本文件中的第一个值查找行
gene_values=[]
with identifier as genelist:
for line in genelist:
parts_genelist=text.split()
with target as expression:
for line in expression:
parts_expression=text.split()
if parts_genelist[1]==parts_expression[0]:
gene_values=gene_values.append[genelist.readlines(), expression.readlines()]
我将不胜感激一些输入和一些帮助做得更好。
请发布“目标文件”和“标识符文件”的片段/样本 – Potrebic
出了什么问题?你有一些小的示例输入文件来演示预期的和实际的输出吗?另外,代码中的“text”是什么:这个变量来自哪里(和'identifier'一样)。 – Evert