from HTMLParser import HTMLParser
from urllib import urlopen
class Spider(HTMLParser):
def __init__(self, url):
HTMLParser.__init__(self)
req = urlopen(url)
self.feed(req.read())
def handle_starttag(self, tag, attrs):
if tag == 'a' and attrs:
print "Found link => %s" % attrs[0][1]
Spider('http://stackoverflow.com/questions/tagged/python')
1
A
回答
3
0
我还没有与蜘蛛搞砸可言,但它打印HTML,或者你只是打印“找到链接...”行?如果你只是印刷那些,你可以做一些像outfl = open('output.txt')
然后,而不是print
,请致电outfl.write("Found link => %s" % attrs[0][1])
。
如果您需要HTML格式,您可以随时在之前写出<html><head></head><body>
,之后写出</body></html>
。此外,使用outfl = open('output.html')
而不是.txt作为文件名。
我完全错过了这里的问题吗?如果你想要更好的答案,你应该更好地描述这个问题。
1
把这个在你的脚本的顶部:
import sys
sys.stdout = file('output.html', 'w')
这一切重定向你的脚本写到标准输出(其中包括print
语句)的文件“output.html”。
相关问题
- 1. 如何通过php将html代码(templete)写入html文件?
- 2. 如何将此代码的输出保存到文件中? (PHP)
- 3. 如何将compressjs输出写入文件
- 4. 如何将python脚本的输出写入html文件
- 5. 如何更改此代码以写入标准输出?
- 6. 不将输出写入文件的代码
- 7. 将输出写入文件
- 8. 如何将HTML代码写入DOM
- 9. python BeautifulSoup如何将输出写入html文件
- 10. 将代码写入输出文件,非公开类型错误
- 11. 如何重写此代码--css和html?
- 12. 如何将此访问代码写入sqlite代码
- 13. R5RS Scheme输入输出:如何将文本写入/附加到输出文件?
- 14. 如何将字节表单输入写入输出文件?
- 15. 如何将mmap输入内存写入O_DIRECT输出文件?
- 16. 如何为此代码编写简单的输入验证
- 17. java输出html代码到文件
- 18. Response.Redirect - 如何将HTML代码/ aspx代码写入response.redirect
- 19. 将输出写入文本文件
- 20. 将输出写入文本文件
- 21. 将Nokogiri输出写入文本文件
- 22. 将fts(3)的输出写入文件
- 23. 将输出写入Graphchi中的文件
- 24. 方案:如何输入html并将其输出为html源代码?
- 25. C++为什么不将此代码写入文件
- 26. 如何在此代码中输入文件?
- 27. 将OutputStream写入文件的代码
- 28. 请将此代码写入正确吗?
- 29. 如何将“java -version”的输出写入文本文件?
- 30. Erlang:如何将我的输出写入文本文件?
我该如何在一个脚本中做到这一点? – 2009-11-12 14:40:45