在Python中我有一长串等(我删除了所有休息时间)切片子在Python列表
stringA = 'abcdefkey:12/eas9ghijklkey:43/e3mnop'
我想要做的是搜索这个字符串的"key:"
所有出现,然后提取"key:"
后面的“值”。我 一个更为复杂的是,我不知道属于关键这些价值有多长(例如key:12/eas9
和key:43/e3
)。我所知道的是,他们不得不以数字结尾,而字符串的其余部分不包含任何数字。
这就是为什么我的想法是从key
指数加上下一切片说10个字符(例如key:12/eas9g
),然后向后工作,直到isdigit()
是假的。
我试图分裂我的初始字符串(也的确含有休息时间):
stringA_split = re.split("\n", stringA)
for linex in stringA_split:
index_start = linex.rfind("key:")
index_end = index_start + 8
print(linex[index_start:index_end]
#then work backward
然而,插入换行符不以任何方式帮助,因为他们是从PDF到TXT转换毫无意义。
那么将如何解决这个问题(例如与获得的各项指标开始“‘关键’”和这片到一个列表)?