我有一个很大的文本文件,我只想提取某些短语/单词之后的数字。在文本文件中抽取特定单词后的数字
有在以下格式这个巨大的文本文件,几十行:
Best CV Model for car: 15778 is order:2 threshold: 0 with AUC of : 0.7185 gene aau_roc: 0.466281
一种解决办法是只看数量后,“汽车:X”,“是为了:X”,“门槛:X“,”Y gene aau_roc:X“!
最后,我想每行有15778,2,0,0.7185,0.466281。
这种模式肯定比我想出的模式简单,但它的缺点是它会匹配与提问者所寻找的行结构不匹配的行上的数字。 – Blckknght
@Blckknght在理论上你的解决方案可能是更完美的解决方案,在现实生活中,采取'较柔和'的解决方案通常是明智的,因此也解析了可能存在拼写错误的行,如'threhsold'而不是'threashold'。我会在这里使用这个解决方案。 – erikbwork