0
最近,我编写了一个python脚本来解析网页中的特定行。此代码工作正常,但每当我运行它,它的下载和工作目录中写入文件“.PHP”:如何在不写入光盘的情况下读取和解析html文件
#!/usr/bin/env python
import wget
import re
from HTMLParser import HTMLParser
import tempfile
url = "http://tuberculist.epfl.ch/quicksearch.php?gene+name=0009&submit=Search#sequence"
filname = wget.download(url)
a = open(filname,'r')
b = a.readlines()
f = "|Rv0009|"
for c in b:
if f in c:
pattern = re.compile("> >.+<br /></")
z = pattern.findall(c)
print z
我应该做什么样的变化,这样无需编写一个文件时,它会分析所需的行。
您可以使用'urllib2'模块(或[requests](http://requests.readthedocs.org/en/latest/)模块,如果有的话)将页面内容下载到变量在记忆中。 –
@qwrrty感谢它的工作正常。 – user2935002