我想从列表中写入项目到几个文件。我想根据它的日期来命名每个文件。请记住,我知道我不应该使用正则表达式来抓取HTML,但暂时它可以为我提供良好的服务。对不起,但我是初学者。这种刮擦只是为了学术目的。先谢谢你。从列表中写入项目到几个文件 - Python
from urllib import urlopen
import re
webpage = urlopen('x').read()
date = re.compile('[0-9]{2}-[a-zA-Z]{3}-[0-9]{4}')
article = re.compile('<span>.*<div>', re.DOTALL)
findDate = re.findall(patFinderDate,webpage)
findArticle = re.findall(patFinderArticle,webpage)
listIterator = []
listIterator[:] = range(0,1000)
for i in listIterator:
filename = findDate[i]
with open(filename,"w") as f:
f.write(i)
f.close()
你可以在范围(0,1000)内为我(或者甚至在范围内为1000) ')...这里不需要'listIterator'。 – mgilson
使用正则表达式来刮取html有什么问题? –
另外,你应该更清楚你的问题实际上是什么......这是干什么的?它应该做什么? – mgilson