2015-08-20 50 views
9

这被标记为偏题但留在堆栈溢出,以防其他人有这个相同的问题。你能刮一个Angular JS网站吗

这可能超出了范围,但我很想知道你是否可以刮一个Angular JS网站?

如果有人能指点我一些好的资源吗?我做了一些R & D,但找不到任何有用的资源,除了Phantom JS

+1

我不确定你是否想出了一个解决方案来做到这一点,但最简单的答案是使用'phantomjs'这是一个无头浏览器,让你用css选择器编写脚本并获取数据,并用它做任何你想做的事情。 http://phantomjs.org让我知道你是否需要进一步的帮助。 P.S我不确定这是如何投票脱离主题。 –

回答

3

对这个问题最简单的答案是肯定的,这是可能的,但不使用传统的机器人,只看他们原始的文本内容进入HTTP响应体,并不真正解释运行JavaScript的典型浏览器会看到什么。谷歌做它(截至5月2014年): http://googlewebmastercentral.blogspot.com/2014/05/understanding-web-pages-better.html

如果您有解析JavaScript和允许正常的HTTP XHR请求走出去,获取填充一个SPA的实际数据的机器人,你可以刮的角部位。

+1

也有用的信息:http://thiagomarzagao.com/2013/11/17/webscraping-with-selenium-part-5/ – wesww