2016-08-14 25 views
-1

如何在python3中使用请求登录tumblr? 这是我的代码,但它不能很好的工作,并返回到登录页面。 我使用request.post来发布登录表单数据,并失败。python3登录网站tumblr.com

import requests 
from bs4 import BeautifulSoup 

start_url = 'https://www.tumblr.com' 

# set a session for request 
s = requests.Session() 
s.headers.update({'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0', 'accept-language': 'zh-CN,zh;'} 
       ) 

# get the form_key for login_in 
r = s.get(start_url) 
login_soup = BeautifulSoup(r.text, 'lxml') 
hidden_div = login_soup.find('div', class_='form_row_hidden').find_all('input') 
key_dict = {} 

for input_tag in hidden_div: 
    tmp_dict = input_tag.attrs 
    key_dict.update({tmp_dict['name']: tmp_dict['value']}) 

user_data_dict = {'determine_email': '×××××××××', 
        'user[email]': '××××××××', 
        'user[password]': '××××××××', 
        'user[age]': '', 
        'tumblelog[name]': ''} 

key_dict.update(user_data_dict) 


# log in tumblr 
r_login=s.post(start_url, headers=headers, data=key_dict) 

home_soup=BeautifulSoup(r.text, 'lxml') 
print(home_soup) 
# the output is still the log-in page. 
+0

你的例外是什么?为什么不使用[pytumblr](https://github.com/tumblr/pytumblr)API库? – cuongnv23

+0

我可以只使用请求来登录tumblr而不是使用API​​吗? – aquasamss

+0

你可以。首先,您必须向用户代理商提出tumblr.com/login的获取请求,就像您一样。在这个请求的结果中,你必须解析并得到'form_key'的值,这个值用来做一个真正的post来登录。获得'form_key'之后,将其包含在'key_dict'中并发布信息。为确保您已经登录,请向https://www.tumblr.com/svc/post/get_post_form_builder_data发送获取请求以确认。 – cuongnv23

回答

2

你几乎是目标。

首先,你必须要求tumblr登录页面(https://tumblr.com/login)。 (你没有)

然后,你必须解析html页面,并得到form_key值。该值用于进行真正的登录。

最后,请POST请求,与有效载荷:

{'user[email]': your_mail, 
'user[password]': your_pass, 
'form_key': form_key 
} 

下面是在Python 2示例代码,但我不使用BeautifulSoup(你问到只使用requests;)

In [1]: import requests 

In [2]: from lxml import html 

In [3]: url = 'https://www.tumblr.com/login' 

In [4]: ua = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36' 

In [5]: headers = {'User-Agent': ua} 

In [6]: s = requests.session() 

In [7]: lg = s.post(url, headers=headers) 

In [8]: lg_html = html.fromstring(str(lg.text)) 

In [9]: form_key = lg_html.xpath("//meta[@name='tumblr-form-key']/@content")[0] 

In [10]: payload = {'user[email]': 'your_mail', 
    ....:   'user[password]': 'your_pass', 
    ....:   'form_key': form_key} 

In [11]: # real login 

In [12]: s.post(url, headers=headers, data=payload) 
Out[12]: <Response [200]> 

In [13]: print s.get('https://www.tumblr.com/svc/post/get_post_form_builder_data').text 
{"meta":{"status":200,"msg":"OK"},"response":{"channels":[{"name":"your_name","tags":[]}],"limits":{"videoSecondsRemaining":300,"preuploadPhotoUsed":0,"preuploadAudioUsed":0,"inlineEmbedsPerPost":5}}} 
+0

请包括一个完整的答案,不只是引用评论。现在,这不是一个真正的答案 –

+0

为什么这不是一个答案? OP询问如何使用'requests'来登录tumblr,并且我的代码可以做到这一点。 – cuongnv23

+0

你应该多解释一下。包括你在评论中说的话,只是描述它是如何工作的。 –