我试图让脚本访问一个网页。它加载第一页,找到登录表单,填写并提交。该网站的工作原理与Facebook一样,如果您已经将cookie重定向到您的供稿列表,那么您的cookie已经被重定向到登录页面。 但作为回应,我不明白另一页,简得到一个字符串这样的:用机械化python登录。返回的字符串
S1:1MEqkcRcZQ7x6adaszkZUQyRFRhCfXz1z:c2c8d18f12f50ab3e8daA1cf80a0d8b9f64e9d6684b8eb064dd76892d6134cde:1646683
它像4串用“:”隔开。第一我不知道是什么。第二个是用户名,第三个是我的哈希密码(我想),最后一个是我的用户ID。 在FF中进行测试后,我发现这是一个Javascript问题,如果您的浏览器没有启用Javascript,您在登录后会得到该字符串。
这里是我的代码>
import mechanize
import urllib
import cookielib
# Browser
br = mechanize.Browser()
# Cookie Jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
# Browser options
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True )
br.set_handle_robots(False)
# Follows refresh 0 but not hangs on refresh > 0
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
# Want debugging messages?
br.set_debug_http(True)
br.set_debug_redirects(True)
br.set_debug_responses(True)
# User-Agent (this is cheating, ok?)
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.3')]
# If the protected site didn't receive the authentication data you would
wallet = 'username'
password = 'password'
response = br.open('https://www.example.com/')
#html = response.read()
# Show the source
#print html
# or
#print br.response().read()
# Show the html title
print br.title()
#print response.read()
# Show the response headers
#print response.info()
# or
#print br.response().info()
# Show the available forms
for form in br.forms():
print "Form name:", form.name
print form
# Select the login form
br.select_form(nr=2)
# Let's login
#br.form['op'] = 'login'
br.form['login'] = wallet
br.form['password'] = password
response1 = br.submit()
print response1
print response1.read()
print "#######################"
cookie = cookielib.Cookie(version=0, name='PON', value="response1.read()", expires=365, port=None, port_specified=False, domain='https://www.example.com/', domain_specified=True, domain_initial_dot=False, path='/', path_specified=True, secure=True, discard=False, comment=None, comment_url=None, rest={'HttpOnly': False}, rfc2109=False)
cj.set_cookie(cookie)
response = br.open(https://www.example.com/)
因为我不知道该字符串是什么,我想这是一个Cookie,所以我试图把我的Cookiejar,并试图br.open(URL)再次,但它总是返回登录页面。 我必须复制网站的JavaScript在python中所做的,但到目前为止我被困住了。 有什么想法?我已经尝试阅读网站的源代码,但我没有找到导致我麻烦的脚本。它可能在头标签内吗?我不知道。
你已经标记了3种语言,但只显示一个,这是相关的,哪些不是? –
尝试手动将referer头添加到同一个域。 – YOU
我不记得添加PHP作为标签。只有JavaScript和python – georgesilva