我试图抓取一些在后台运行AJAX的网页。使用python和Selenium,我已经得到了加载网页,输入数据到表单,点击提交和等待。在这一点上,我试图抓住JSON格式的数据,但this文章建议让JSON身体不可能。我试图自己查看Selenium代码,以便让它返回所有内容,但我没有多少运气。任何一个遇到过类似问题并且有如何解决它的建议?我不必使用硒(或蟒蛇) 谢谢!使用Selenium和Python进行Web浏览:捕获JSON主体
0
A
回答
0
在这种情况下,您应该能够直接获取JSON。 JSON位于here。您可以使用firefox和firebug来检查XHR请求以找到它。
0
我通过查看网站正在执行的ajax调用(在源代码中)来做到这一点。这通常是一个POST(有时是一个GET)。然后我cURL(PHP)或urllib2(Python)那个URL +发送所需的数据。这会返回body,包括我的JSON。
相关问题
- 1. 使用Selenium RC捕获浏览器
- 2. 用python进行web浏览selenium:找到模态元素
- 3. 使用Selenium从浏览器调用捕获输出
- 4. 使用Python进行视频捕获
- 5. 使用Python捕获PDF文件Selenium Webdriver
- 6. Selenium/Python浏览器循环
- 7. 使用scala-js-env-selenium进行交叉浏览器测试
- 8. 使用NetBeans在Selenium上进行跨浏览器测试
- 9. 谷歌浏览器使用Selenium进行节流
- 10. 使用移动浏览器捕获UDID
- 11. 在python中使用Selenium并行浏览器测试
- 12. 使用Python进行Web浏览Selenium:无法点击JavaScript调用href标签中的函数的链接
- 13. 从Selenium和Python捕获输出
- 14. 使用Restlet和JSON主体进行多部分POST处理
- 15. 捕获浏览器的现有cookie,使用python
- 16. Android Web浏览器主页
- 17. 使用Selenium和Java获取浏览器呈现的HTML
- 18. 使用Cucumber和Selenium进行测试:如何查看浏览器中的内容?
- 19. Selenium Webdriver,Python - 从浏览器捕获文本并存储在变量中?
- 20. 使用axios post捕获错误主体
- 21. 如何在浏览器中进行视频捕获?
- 22. 如何使用python和selenium webdriver捕获https网站数据
- 23. Selenium截图侦听器捕获错误的浏览器
- 24. 在Selenium WebDriver中捕获JavaScript错误 - 与浏览器无关
- 25. 结合浏览器和web应用程序进行部署
- 26. 捕获浏览器事件
- 27. 用于更改数据捕获的主浏览器
- 28. 用Selenium WebDriver运行TOR浏览器
- 29. 如何使用Web浏览器进行P2P流式传输?
- 30. 使用C#和web浏览器
我喜欢这样做,但该网站使用JQuery,所以这就是为什么我首先使用Selenium做它。你有没有遇到过这样的情景? – 2013-03-24 09:48:22
这很容易做到。如果需要,您可以注入一些JavaScript来公开JSON。不过,这是根据个案情况而定的。如果您可以发布您的网址,则可以进一步评论。 – user1609452 2013-03-24 10:06:47
@ user1609452当然可以!网址如下。我试图提取日期和价格。正如你所看到的,页面加载了一段时间。使用Firebug我可以看到JSON加载,而这正是我想要捕获的。我在想这应该不会太难... http://www.celebritycruises.com/search/vacationSearchResults.do?wuc=USA#isWidget=false&dest=ANY&sailStartDate=ANY&sailEndDate=ANY&ship=ANY&port=ANY&duration=ANY&includeAdjascentPorts = Y&promoid =&promoType =&promotionTypeId =&priceProgram =&sortBy = 4&STARTROW = 0&计数= 10&cruiseType = CO&cruiseInt = Y&isCrieriaExcluded =假 – 2013-03-24 10:39:54