所以我的兄弟想让我用Python编写一个网络爬虫(自学),我知道C++,Java和一些html。我使用2.7版本和阅读python库,但我有一些问题 1. httplib.HTTPConnection
和request
概念给我是新的,我不明白它是否下载像cookie或实例的html脚本。如果你同时做这两件事,你会得到一个网站页面的来源吗?以及我需要知道的修改页面并返回修改页面的词汇是什么。Python网络爬虫和“获取”html源代码
只为背景,我需要下载一个网页,并与那些我有
更换任何IMG那将是很好,如果你们能告诉我你的2.7和3.1
您正在使用哪个Python模块或库?你说的是什么? – 2010-08-20 18:06:32
@David - 我修正了我的规格 – danutenshu 2010-08-20 18:10:03