0
我试图执行下面的代码,并获取joblocations执行时的错误。页面加载到ulrs但位置不是从网页中提取。试图执行r网络抓取代码,但给出了一个错误
library(data.table)
library(XML)
pages<-c(1:12)
ulrs <- rbindlist(lapply(pages, function(x)
{url <- paste("http://www.r-users.com/jobs/page/",x,"/",sep = " ")
data.frame(url)}),fill = TRUE)
joblocations <- rbindlist(apply(ulrs,1,function(url){
doc1 <- htmlParse(url)
locations <- getNodeSet(doc1,'//*[@id="mainContent"]/div[2]/ol/li/dl/dd[3]/span/text()')
data.frame(sapply(locations,function(x){xmlValue(x)}))
}),fill = TRUE)
Error: failed to load external entity "http://www.r-users.com/jobs/page/%201%20/"
hello Jul ...仍然出现此错误 open.connection错误(x,“rb”):HTTP错误404. –
刚编辑答案。问题在于'paste'命令的'sep'参数。 'sep =“”'应该可以工作,但是当构建网页抓取的URL时,最好使用'paste0'代替。 – Jul
非常感谢你..现在工作.... –