1
我有这样一个文件的文件:独立段落
cluster number 1
1
2
3
cluster number 2
1
2
3
cluster number x
1
2
3
我想分割的簇号段这个文件,这样
cluster number 1
1
2
3
我试图寻找一个答案但我无法处理它。 感谢您的帮助!
我有这样一个文件的文件:独立段落
cluster number 1
1
2
3
cluster number 2
1
2
3
cluster number x
1
2
3
我想分割的簇号段这个文件,这样
cluster number 1
1
2
3
我试图寻找一个答案但我无法处理它。 感谢您的帮助!
用户正则表达式
import re
input_text = "..."
r = re.findall(r"(cluster number (\d+)\n\n(\d+)\n\n(\d+)\n\n(\d+))", input_text)
print r
文章
[('cluster number 1\n\n1\n\n2\n\n3', '1', '1', '2', '3'),
('cluster number 2\n\n1\n\n2\n\n3', '2', '1', '2', '3')]
这个代码回报,你还可以看到从here
的详细解释,建议,你应该使用正则表达式。也许re.split函数适合这里:
>>> l = re.split('cluster number (?:\d+)', x)[1:]
>>> [a.split() for a in l]
[['1', '2', '3'], ['1', '2', '3'], ...]
用什么语言? – Barmar
我想追加到Barmars语言问题,以及从什么文件格式? – tremor
要添加到两个:你到目前为止尝试过什么? –