我对R相当陌生,在从福布斯网站提取数据时遇到问题。R中的URL问题
我的当前的功能是:
URL =
http://www.forbes.com/global2000/list/#page:1_sort:0_direction:asc_search:_filter:All%20industries_filter:All%20countries_filter:All%20states
数据= readHTMLTable(URL)
然而,当我改变页面#在url从1到2(或以任何其它数字),所拉出的数据与第1页中的数据相同。出于某种原因,R不会从正确的页面提取数据。如果您手动将链接粘贴到具有特定页面的浏览器中,则可以正常工作。
有没有人有一个想法,为什么发生这种情况?
谢谢!
数据正在通过javascript加载,并且不在从服务器发送的页面的实际HTML中。如果你需要一个可以运行javascript的抓取方法,试试RSelenium包。 – MrFlick 2015-02-11 21:46:44
太好了。我会尝试RSelenium软件包。谢谢! – 2015-02-12 18:23:26