0
给定两个URL,其中第一个URL(URL1)执行一些操作后到达第二个URL(URL2)。扫描“呼叫处理”项目的网页
我希望扫描URL1以寻找可能导致第二个URL的动作链接/按钮。 [我知道完整的URL以及两个URL的查询参数]
你会建议使用什么方法/工具包作为最佳方法。
给定两个URL,其中第一个URL(URL1)执行一些操作后到达第二个URL(URL2)。扫描“呼叫处理”项目的网页
我希望扫描URL1以寻找可能导致第二个URL的动作链接/按钮。 [我知道完整的URL以及两个URL的查询参数]
你会建议使用什么方法/工具包作为最佳方法。
如果URL1网页上的所有链接是静态链接(不被JS /服务器端的操作生成的),那么你可以使用例如jQuery和得到的所有元素与HREF(用行动形式)属性是这样的:
$('a[href$="ABC"]')
$('form[action$="ABC"]')
类似的问题:Select <a> which href ends with some string
对于蟒蛇可能是有用的意愿:http://pypi.python.org/pypi/pyquery
感谢我期待在pyquery。 – subiet
我最终在Python中使用BeautifulSoup进行提取。 – subiet
不错的选择,我用BeautifulSoup的一些不同的目标 –