2015-10-11 27 views
-1

我试图让脚本访问一个网页。它加载第一页,找到登录表单,填写并提交。该网站的工作原理与Facebook一样,如果您已经将cookie重定向到您的供稿列表,那么您的cookie已经被重定向到登录页面。 但作为回应,我不明白另一页,简得到一个字符串这样的:用机械化python登录。返回的字符串

S1:1MEqkcRcZQ7x6adaszkZUQyRFRhCfXz1z:c2c8d18f12f50ab3e8daA1cf80a0d8b9f64e9d6684b8eb064dd76892d6134cde:1646683

它像4串用“:”隔开。第一我不知道是什么。第二个是用户名,第三个是我的哈希密码(我想),最后一个是我的用户ID。 在FF中进行测试后,我发现这是一个Javascript问题,如果您的浏览器没有启用Javascript,您在登录后会得到该字符串。

这里是我的代码>

import mechanize 
    import urllib 
    import cookielib 

    # Browser 
    br = mechanize.Browser() 

    # Cookie Jar 
    cj = cookielib.LWPCookieJar() 
    br.set_cookiejar(cj) 

    # Browser options 
    br.set_handle_equiv(True) 
    br.set_handle_gzip(True) 
    br.set_handle_redirect(True) 
    br.set_handle_referer(True ) 
    br.set_handle_robots(False) 

    # Follows refresh 0 but not hangs on refresh > 0 
    br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1) 

    # Want debugging messages? 
    br.set_debug_http(True) 
    br.set_debug_redirects(True) 
    br.set_debug_responses(True) 

    # User-Agent (this is cheating, ok?) 
    br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.3')] 

    # If the protected site didn't receive the authentication data you would 
    wallet = 'username' 
    password = 'password' 

    response = br.open('https://www.example.com/') 
    #html = response.read() 

    # Show the source 
    #print html 
    # or 
    #print br.response().read() 

    # Show the html title 
    print br.title() 
    #print response.read() 


    # Show the response headers 
    #print response.info() 
    # or 
    #print br.response().info() 

    # Show the available forms 
    for form in br.forms(): 
     print "Form name:", form.name 
     print form 

    # Select the login form 
    br.select_form(nr=2) 

    # Let's login 
    #br.form['op'] = 'login' 
    br.form['login'] = wallet 
    br.form['password'] = password 
    response1 = br.submit() 

    print response1 
    print response1.read() 
    print "#######################" 
    cookie = cookielib.Cookie(version=0, name='PON', value="response1.read()", expires=365, port=None, port_specified=False, domain='https://www.example.com/', domain_specified=True, domain_initial_dot=False, path='/', path_specified=True, secure=True, discard=False, comment=None, comment_url=None, rest={'HttpOnly': False}, rfc2109=False) 
    cj.set_cookie(cookie) 
    response = br.open(https://www.example.com/) 

因为我不知道该字符串是什么,我想这是一个Cookie,所以我试图把我的Cookiejar,并试图br.open(URL)再次,但它总是返回登录页面。 我必须复制网站的JavaScript在python中所做的,但到目前为止我被困住了。 有什么想法?我已经尝试阅读网站的源代码,但我没有找到导致我麻烦的脚本。它可能在头标签内吗?我不知道。

+2

你已经标记了3种语言,但只显示一个,这是相关的,哪些不是? –

+0

尝试手动将referer头添加到同一个域。 – YOU

+0

我不记得添加PHP作为标签。只有JavaScript和python – georgesilva

回答

0

我明白了。 我的错误是尝试使用所有字符串设置Cookie。字符串的每个部分都是不同的cookie。我使用Chrome扩展名“Live HTTP Headers”获得的Cookie的名称。