将HTML文档读入R

此页面：http://www.navysports.com/sports/m-footbl/stats/2015-2016/teamcume.html与大多数使用R的HTML页面不同，因为我使用readHTMLTable不允许它工作。我得到的回应是将HTML文档读入R

$'NULL'

我试图采取撑船数据出来的页面，然后将其导入R.我怎么会导入文本如果readHTMLTable不起作用？

来源

2015-10-27 user5493735

如果您查看该页面的来源，这些表格不是html表格，它们可能是复制粘贴ascii表格。它们被包裹在<pre>标签了，所以：

res <- htmlParse("http://www.navysports.com/sports/m-footbl/stats/2015-2016/teamcume.html") 
x <- xpathSApply(res, "//pre", xmlValue) 
substring(x[[1]], 1, 300) 

[1] "\r\n\r\n\r\n        2015 Navy Football\r\n    Navy Overall Team Statistics (as of Oct 24, 2015)\r\n         All games\r\n\r\nTEAM STATISTICS      NAVY   OPP\r\n--------------------------------------------------------\r\nSCORING......"

在该字符串与任何的各种功能的读取。

来源

2015-10-27 13:45:09 sckott

但是我无法从字符值中获取数据。我正在尝试超过10000的东西，它给了我引号作为结果。 – user5493735

1000_中的_trying是什么意思？你能分享你试过的代码吗 – sckott

那么1到300的字符数是不是？如果我想要做的字符一路下滑的页面，不会我需要做的：子（X [[1]]，5000，5300）我得到的是 “” – user5493735

将HTML文档读入R

回答

相关问题