我想从Web服务器提取某些.html文件。我的意图是从一个网站(http://www.thetabworld.com/)获取文件名为“metallica”的.html文件。这怎么可能使用python?我听说过urllib2,但作为一个python noob,我没有丝毫的想法如何使用它。从Web服务器提取某些.html文件
0
A
回答
1
“我听说过的urllib2但作为 蟒蛇小白,我没有丝毫的一个想法 如何使用它。”
好吧,如果你不知道如何使用urllib2,阅读一些文档将是一个好的开始。
以下是优秀的资源(举例):
official python docs for urllib2
urllib2 - the missing manual
urllib2 cookbook
PMOTW - urllib2
1
您需要将urllib2与HTML解析器(如lxml
或BeautifulSoup
)一起使用,才能从检索到的页面中提取链接以便抓取网站。
相关问题
- 1. 从Web服务器读取XML文件
- 2. 仅提取某些行从文件
- 3. 防止访问Web服务器中的某些文件 - mercurial/ssh
- 4. Web服务器上的Zip文件提取到本地机器
- 5. Samba文件服务器隐藏某些用户的文件夹
- 6. 如何提取从HTML文本(某些字符串后)
- 7. J2EE:从Web服务器访问文件。
- 8. 从Web服务器下载文件
- 9. 如何在Python中从一台服务器获取某些类型的文件到另一台服务器?
- 10. git:只提取某些文件
- 11. 如何限制某些Web服务方法给某些用户?
- 12. 从SOAP Web服务中提取列表
- 13. 从服务器保存html文件
- 14. 如何从“某些”服务器上的instagram获取数据
- 15. 从Windows Web服务获取Linux服务器硬件信息
- 16. 如何从Web服务器提供JSON?
- 17. 如何在Windows中从XAMPP apache服务器提供html文件
- 18. GAE如何从服务器动态提供html文件
- 19. 从Google云端存储服务器提供HTML文件
- 20. 从docx文件中提取某些字体的文本
- 21. 如何从文本文件集合中提取某些值
- 22. 如何从文件中提取某些文本?
- 23. 从文本文件中提取某些行
- 24. 如何列出Web服务器上某些文件夹中的某些特定图像?
- 25. 实体提取Web服务
- 26. 从html调用web服务
- 27. 是否可以从它的HTML输出中提取服务器端文件?
- 28. 如何从Web服务器上的xml文件读取数据
- 29. 从服务器读取文件与一些偏移量
- 30. 从Web服务器
RTFM是不是一个非常有用的响应 – 2010-09-30 16:43:26
史蒂夫,我的回答给了最好的4个有用的链接关于urrlib2的资源..并被OP接受。所以,我会称之为“有用的回应”。 – 2010-09-30 16:57:21