我从网站拉HTML,HTML拉使网站觉得我只是浏览该网站的用户,像这样:无法通过发送头从网站
def page(goo):
import fileinput
import sys, heapq, array, urllib
import BeautifulSoup
from BeautifulSoup import BeautifulSoup
import re
from urllib import FancyURLopener
class MyOpener(FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()
filehandle = myopener.open(goo)
return filehandle.read()
page=page(WebSite)
这与工作完美大多数网站,甚至谷歌和维基百科,但不与Tmart.com。不知何故,Tmart可以看到它不是网络浏览器,并返回一个错误。我怎样才能解决这个问题?
如果您复制并粘贴错误或堆栈跟踪,这将是很有帮助。 – aychedee
提示:有问题的网站使用java脚本来设置cookie并忽略没有正确cookie的请求。 –
什么是* wab *网站? –