0
此页面:http://www.navysports.com/sports/m-footbl/stats/2015-2016/teamcume.html与大多数使用R的HTML页面不同,因为我使用readHTMLTable不允许它工作。我得到的回应是将HTML文档读入R
$'NULL'
我试图采取撑船数据出来的页面,然后将其导入R.我怎么会导入文本如果readHTMLTable不起作用?
此页面:http://www.navysports.com/sports/m-footbl/stats/2015-2016/teamcume.html与大多数使用R的HTML页面不同,因为我使用readHTMLTable不允许它工作。我得到的回应是将HTML文档读入R
$'NULL'
我试图采取撑船数据出来的页面,然后将其导入R.我怎么会导入文本如果readHTMLTable不起作用?
如果您查看该页面的来源,这些表格不是html表格,它们可能是复制粘贴ascii表格。它们被包裹在<pre>
标签了,所以:
res <- htmlParse("http://www.navysports.com/sports/m-footbl/stats/2015-2016/teamcume.html")
x <- xpathSApply(res, "//pre", xmlValue)
substring(x[[1]], 1, 300)
[1] "\r\n\r\n\r\n 2015 Navy Football\r\n Navy Overall Team Statistics (as of Oct 24, 2015)\r\n All games\r\n\r\nTEAM STATISTICS NAVY OPP\r\n--------------------------------------------------------\r\nSCORING......"
在该字符串与任何的各种功能的读取。
但是我无法从字符值中获取数据。我正在尝试超过10000的东西,它给了我引号作为结果。 – user5493735
1000_中的_trying是什么意思?你能分享你试过的代码吗 – sckott
那么1到300的字符数是不是? 如果我想要做的字符一路下滑的页面,不会我需要做的: 子(X [[1]],5000,5300) 我得到的是 “” – user5493735