2014-06-23 48 views
0

我有一个sreadsheet,它使用了来自fangraphs.com的大量数据。下面是我使用的数据集的一个示例:从Web导出电子表格导入数据

http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=0&season=2014&month=0&season1=2013&ind=0&team=0&rost=0&age=0&filter=&players=0

下面是另一个例子:

http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=0&season=2014&month=13&season1=2013&ind=0&team=0&rost=0&age=0&filter=&players=0

所以我的电子表格中我有一个包含数据的标签当您在该网站上选择“导出数据”时您会看到。目前,当我想要更新数据时,我需要转到该网站并手动导出每个电子表格并将其粘贴到我的主表单的标签中。

如何使用可输出表单的数据自动更新主表中的两个选项卡?一位朋友提到我可以使用R,所以我下载了它,但我不确定从哪里开始寻找自己如何做到这一点。

在此先感谢,如果您需要更多详细信息,请让我知道!

回答

0

您可能需要下载球队每队,以确保您不会在表中错过了一些行: 例如,对于天使(= 1队)

library(XML) 
x=readHTMLTable(doc = "http://www.fangraphs.com/leaders.aspx?pos=p&stats=bat&lg=all&qual=0&type=0&season=2014&month=0&season1=2013&ind=0&team=1&rost=0&age=0&filter=&players=0") 
x[[33]] 
+0

所以,换句话说, ,你建议直接从网站上阅读并一次去一个团队? – fullOfQuestions

+0

可能要添加'library(XML)'来澄清 –

+0

@fullOfQuestions是这是一个建议。虽然不是一个建议。但是对于你的问题可能的解决方案。 – RockScience