我有一个看起来像这样(但更大)的文件:解析文本文件一行行,跳过某些行
>some text
ABC
DEF
GHI
>some more text
JKL
MNO
PQR
我已经玩了Java中有一段时间,并已能够用线条构建数组等。具有'>'的线条通常是一条线,但有时可能是2条,3条或更多条线。不以'>'开始的行的字符长度相同,但可能有10,20或30或更多这些行。我在点现在在哪里,我想创建一个字符串数组,数组中的每个字符串包含不以“>”,像这样开头的行的字符串:
array element 1 = ABCDEFGHI
array element 2 = JKLMONPQR
我觉得像我很近,但需要一个小屁股踢我才能去。我确信这对专业人士来说很容易,但我对Java仍然很陌生。
具体问题与我在此板上制作的其他帖子有关。这是一个FASTA文件:
>3BHS_BOVIN (P14893) 3 beta-hydroxysteroid
AGWSCLVTGGGGFLGQRIICLLVEEKDLQEIRVLDKVFRPEVREEFSKLQSKIKLTLLEG
DILDEQCLKGACQGTSVVIHTASVIDVRNAVPRETIMNVNVKGTQLLLEACVQASVPVFI
>41_BOVIN (Q9N179) Protein 4.1
MHCKVSLLDDTVYECVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAK
EIKKQVRGVPWNFTFNVKFYPPDPAQLTEDITRYYLCLQLRQDIVSGRLPCSFATLALLG
SYTIQSELGDYDPELHGADYVSDFKLAPNQTKELEEKVMELHKSYRSMTPAQADLEFLEN
>5NTD_BOVIN (Q05927) 5'-nucleotidase
MNPGAARTPALRILPLGALLWPAARPWELTILHTNDVHSRLEQTSEDSSKCVNASRCVGG
VARLATKVHQIRRAEPHVLLLDAGDQYQGTIWFTVYKGTEVAHFMNALGYESMALGNHEF
DNGVEGLIDPLLKEVNFPILSANIKAKGPLASKISGLYSPYKILTVGDEVVGIVGYTSKE
TPFLSNPGTNLVFEDEITALQPEVDKLKTLNVNKIIALGHSGFEVDKLIAQKVKGVDVVV
我最终需要在他们自己的数组元素中的序列,以便我可以稍后操作它们。
什么是* *的具体问题?你知道如何连接字符串吗?你知道如何识别一个字符串是否以'>开头'''? – 2011-06-14 23:11:55
我有一个文件行的数组,我可以确定哪些以'>'开头,是的...我也可以连接行,但只选择那些并将它们作为数组中的元素是我的位置遇到麻烦。 – nicorellius 2011-06-14 23:16:24