2012-01-24 41 views
0

给定两个URL,其中第一个URL(URL1)执行一些操作后到达第二个URL(URL2)。扫描“呼叫处理”项目的网页

我希望扫描URL1以寻找可能导致第二个URL的动作链接/按钮。 [我知道完整的URL以及两个URL的查询参数]

你会建议使用什么方法/工具包作为最佳方法。

回答

0

如果URL1网页上的所有链接是静态链接(不被JS /服务器端的操作生成的),那么你可以使用例如jQuery和得到的所有元素与HREF(用行动形式)属性是这样的:

$('a[href$="ABC"]') 
$('form[action$="ABC"]') 

类似的问题:Select <a> which href ends with some string

对于蟒蛇可能是有用的意愿:http://pypi.python.org/pypi/pyquery

+0

感谢我期待在pyquery。 – subiet

+1

我最终在Python中使用BeautifulSoup进行提取。 – subiet

+0

不错的选择,我用BeautifulSoup的一些不同的目标 –