2015-05-26 129 views
0

什么即时试图做的是使刮刀,有一个登录页面,即时填写三分之二需要三个值的获取下一个页面的Python解析XML

刮板需要用户名上,密码的单行然后令牌,

即时通讯自动填充的用户名和密码和ive缩小到PHP的一个输入标签的HTML响应。

的标签代码:

<input type="hidden" name="licence[_csrf_token]" value="SOME RANDOM CHECKSUM" id="licence__csrf_token" /> 

有没有得到这个任何方式和方式的校验和是动态的,如它改变长度。

+0

你是什么意思“得到这个”呢?另外,你用什么工具从HTML中提取输入标签? –

回答

0

BeautifulSoup是解析任意的HTML一个好办法:

from bs4 import BeautifulSoup 

html_doc = '''<input type="hidden" 
        name="licence[_csrf_token]" 
        value="SOME RANDOM CHECKSUM" 
        id="licence__csrf_token" />''' 

soup = BeautifulSoup(html_doc) 
print soup.input['value']