试图刮掉维基百科页面,等等这些我以前[R拍击readHTMLTable呼吁维基百科
library(XML)
myURL <- "http://en.wikipedia.org/wiki/List_of_US_Open_MenUs_Singles_champions"
y <- readHTMLTable(myURL, stringsAsFactors = FALSE)
R来多次崩溃无论是在RStudio或标准GUI
其他SO评论上类似的问题,建议使用readlines方法
u=url(myURL)
readLines(u) # cannot open: HTTP status was '404 Not Found'
URL被重定向实际上这样进入了最后的URL
个myURL <- "http://en.wikipedia.org/wiki/List_of_US_Open_Men%27s_Singles_champions"
这次readlines方法确实输出的页面,但使用的XML功能,包括htmlParse,仍然会造成死机
TIA
的确有在'XML'错误封装,可能在'RS_XML_ParseTree'中,如@benbolker在我的答案的评论中所示。 – Andrie