0
我试图从http://stats.nba.com/team/#!/1610612742/刮掉关于名单数据的数据。到目前为止,我已经试过RCurl和XML封装,心中已经试过代码如下:刮掉NBA.com的数据
library(RCurl)
library(XML)
webpage <- getURL("http://stats.nba.com/team/#!/1610612742/")
webpage <- readLines(tc <- textConnection(webpage));
pagetree <- htmlTreeParse(webpage, useInternalNodes = TRUE)
x <- unlist(xpathApply(pagetree,"//*nba-stat-table_overflow/player",xmlValue))
Content <- gsub(pattern = "([\t\n])",
replacement = " ", x = x, ignore.case = TRUE)
我相信我的xpathApply功能被误格式化。我应该选择什么样的路径才能进入名单表?
它看起来像通过JavaScript以某种方式加载数据,这意味着你需要拉动HTML像RSelenium,它可以控制浏览器实际运行必要的脚本。 [这是一个例子。](http://stackoverflow.com/a/41497119/4497050)当然,一定要阅读条款和条件;他们是相当慷慨的,但非常具体的如何使用他们的统计数据。 – alistaire
我很抱歉,这只是一个网上抓取作业的作业 –
没有道歉的必要;这不是最简单的页面。维基百科是一个更容易实践的网站。 – alistaire