2010-07-05 95 views
0

我正在处理一个小项目,并遇到一个小问题。我所需的脚本需要获取网站并在源HTML文件中查找特定值。值是这样的:帮助HTML解析并将请求发送到Web服务器

id='elementID'> 

<fieldset> 
    <input type='hidden' name='hash' value='e46c945fe32a3' /> 
</fieldset> 

现在,我一直在尝试使用ElementTree库来解析HTML文档发现价值,但我一直不是很成功。我对Python非常陌生,所以我不知道下一步该怎么做。

我一直在使用httplib和urllib/urllib2连接到网站并POST我的登录细节和类似的东西,但我真的不知道如何从页面获取该值。我想我可以发送一个名为'哈希'的输入请求,但我不知道该怎么做。

回答

2

您可能会考虑查看BeautifulSoup库 - 它的设计很快且易于使用。

+0

谢谢,这可能正是我需要的,但我不知道如何真正把它使用。你能给我一些关于如何实际使用BeautifulSoup来搜索HTML文档的提示吗? – 2010-07-05 00:34:03

+0

查看文档的快速入门部分:http://www.crummy.com/software/BeautifulSoup/documentation.html#Quick Start – Amber 2010-07-05 00:46:09