我有一本大书存储在一个纯文本文件中,并且想分析它以便为每章创建单独的文件。我使用一些简单的正则表达式来查找每章的标题,但我很努力地捕捉到所有的文章。将书分解成章节 - Python
import re
txt = open('book.txt', 'r')
for line in txt :
if re.match("^[A-Z]+$", line):
print line,
我知道这是很不成熟,但我足够的新的Python,它的让我有点难倒。目前,我要去一行行,这样我的思维过程是:
- 如果该行是一个章节标题:创建一个新的文件“chapter_title.txt”
- 如果下一行不章节标题:将该行写入chapter_title.txt
虽然我试图写出来的尝试并不成功。感谢帮助!
编辑:具体来说,我很困惑Python语法的文件I/O。我已经尝试过:
for line in txt :
if re.match("^[A-Z]+$", line):
f = open(line + '.txt', 'w')
else f.write(line + "\n")
作为我的一般方法,但这不会像书面工作。希望帮助构建循环。由于
究竟是什么问题?看起来你在正确的方向。 – Maroun
基本上我正在寻找帮助的语法。结构对我来说很有意义,但是我正在努力处理文件I/O – gweintraub
@gweintraub嗯......你怎么知道这行是否是一章? –