2
我写了一个简单的python脚本来解析文本文件。但我的正则表达式需要修改才能在第二组中找到多行。源文本文件的查找文章正则表达式Python
import re
if __name__ == '__main__':
sonnik = open('sonnik.txt').read().decode('utf-8')
article = re.compile(ur'^([A-Za-zА-Яа-я0-9_\-:,\.«» ]+)[\n]{2}^[ ]{5}([A-Za-zА-Яа-я0-9_\-:,\.«» ]+)$',re.M|re.U)
result = article.findall(sonnik)
print len(result)
print '-----'
print result[0][1].decode('utf-8')
print '-----'
实施例:
Банкет
Видеть во сне банкет - хорошо. Друзья будут к Вам благосклонны. Видеть во сне себя в толпе веселых, нарядно одетых гостей, которые едят на дорогой посуде и пьют старые вина баснословной стоимости, предвещает огромную удачу в любых начинаниях и счастье в кругу друзей.
Видеть недружелюбие среди гостей, нелепые пустые столы - является знаком очень тяжелых недоразумений, размолвок и разочарований, ожидающих Вас.
Банкрот
Если Вам снится сон, в котором Вы не можете расплатиться с долгами и чувствуете себя банкротом - то в реальной жизни не бойтесь угрозы с этой стороны. Напротив, Ваша энергия и уверенность в себе позволяет Вам наилучшим образом организовать свои дела.
Однако иные тревоги могут смутить Вашу душу.
Если Вы видите банкротами других, то это означает, что наяву Вам встретятся люди благородные, честные в делах, хотя, возможно, излишней откровенностью они могут Вам навредить.
Молодой особе этот сон обещает небольшую размолвку с любимым, виной чему разность их взглядов.
期限和文章对。文章文本放置在新的行之后,5个空格缩进。当前的正则表达式仅匹配文本的第一行。是否有可能改变正则表达式使用类似循环的组?
谢谢你,它的作品。据我所知,这个未被捕获的小组匹配只是文章的最后一行,这扩大了小组的沟通。 – Dmitry
@Dimm它匹配第一篇文章行后面的每一行。它的工作方式是试图找到5个空格缩进,如果没有匹配,它就停在那里。这就是它如何匹配文章的最后一行:) – Jerry