0
A
回答
1
我通过使用Qt Webkit加载页面并包含JQuery来做类似的事情。
这是一个黑客攻击,但适用于我的用例。我需要一个不需要配置的解决方案 - 只需sudo apt-get install libqt4-webkit然后您就可以开始了。
0
如果你可以通过浏览器支持(如使用浏览器来渲染和创建页面),硒将是完美的。这将具有完全支持Ajax网站的额外好处。
如果不是,像webdriver可能会工作。
我只使用硒。
0
我使用Selenium RC + jQuery进行屏幕抓取。
示例代码:https://github.com/tszming/Selenium-Google-Scrapper
虽然我使用PHP作为客户端,但你可以使用任何你喜欢的语言实现它(只要它可以跟硒RC)。
我曾尝试过几个CSS选择器库,但说实话,最好的解析器是您的浏览器,Selenium RC方法并不快但非常可靠。
相关问题
- 1. 通过选择器添加CSS类
- 2. CSS模块:通过选择
- 3. 通过css选择链接
- 4. CSS选择器,通过儿童选择值
- 5. 无法通过webdriver的CSS选择器进行选择
- 6. 创建通过css传递多个选择器的过滤器
- 7. 通过@选择器对象
- 8. 通过jquery选择器
- 9. 选择CSS选择器
- 10. CSS选择器选择
- 11. 通过Javascript动态选择CSS URL
- 12. 的Python HTML解析通过CSS选择
- 13. 选择框样式通过CSS
- 14. CSS选择器
- 15. CSS选择器 -
- 16. CSS属性选择器优先于普通的CSS类选择器
- 17. 从选择一个元素只能通过CSS选择
- 18. CSS通用选择器(*)特异性
- 19. css选择器或xpath选择器
- 20. CSS选择器后代选择器
- 21. CSS HTML选择器与类选择器
- 22. 选择通过
- 23. 角度过滤器通过选择值
- 24. 通过参数化的CSS选择器查找元素
- 25. 通过css选择器更改dom对象的父类
- 26. 通过选择器获得一个CSS的属性与硒webdriver
- 27. 通过ID选择器不应用CSS背景图像样式
- 28. Nightwatch.js通过CSS选择器查找的问题(最新版本)
- 29. 通过jQuery将CSS应用于多个选择器
- 30. 通过CSS选择器将参数传递给javascript函数
我的第一个想法:最后,有人没有问正则表达式这个问题;)当然,这已经被详细讨论了。 – NotMe 2010-11-15 22:40:31
可能重复的[HTML抓取选项?](http://stackoverflow.com/questions/2861/options-for-html-scraping) – NotMe 2010-11-15 22:40:38
我一直在使用C#刮。我已经写了一个jQuery端口,但是我不敢在这里发布它,因为害怕因为自我推销而被投票遗忘。 – mpen 2010-11-17 05:13:15