2012-02-08 19 views
2

我想从过去的NFL游戏中以播放表的形式导入数据,并且主要在R中工作以收集数据并创建数据集。如何将PBP数据从NFL.com导入到R

我后的数据的一个例子是此页上:http://www.nfl.com/gamecenter/2012020500/2011/POST22/[email protected]#menu=gameinfo&tab=analyze&analyze=playbyplay

我知道NFL.com使用JSON和许多必要的数据都在附加到网站JSON文件。我在R中使用JSON包从这些文件中提取数据的努力一直非常薄弱。任何建议你们都有赞赏。

我只是更好地使用PHP来处理数据?

回答

0

我为一个团队手动提取了一个赛季的所有数据。如果你想要很多游戏的数据,请考虑向联盟发送电子邮件并询问你提到的文件。他们发布数据,所以也许他们会给你的文件。 NFL发言人是Greg Aiello。我怀疑你可以在Google上找到他的电子邮件地址。

对不起,这不是一个建议的编程解决方案。如果这个答案不适合论坛,请删除它。这是我第一个发布的答案。

3

我不知道你是否已经成功的JSON文件加载到R,但在这里就是一个很好的例子:

library(rjson) 
json=fromJSON(file='http://www.nfl.com/liveupdate/game-center/2012020500/2012020500_gtd.json') 
json$`2012020500`$home$stats 

如果你都很难找到的JSON文件的URL,使用Firebug(Firefox的扩展),你可以看到请求JSON文件的网页。

JSON文件当然是庞大而复杂的。但它是复杂的数据。无论你在找什么,都应该在那里。如果你只是寻找播放的播放文本的直转储,那么你可以使用这个网址:

http://www.nfl.com/widget/gc/2011/tabs/cat-post-playbyplay?gameId=2012020500