2011-12-17 25 views
1

我有一个独特的问题,我需要拉特定属性为每个被每5分钟出场的比赛中,两个主要的问题我已经是:从网站措词棒球成绩表

  1. 分句数据以交互方式显示它,即MLB.com,ESPN,CBS Sports。
  2. 找到一个可能会显示实时更新并以文本格式更新的盒子分数的源代码。

我已经做了大量的谷歌搜索,以及寻找可能的解决方案来刮取MLB和CBS Sports的数据。我没有这样的运气,现在有点困难,因为我没有任何新的数据可以玩,但是我一直在寻找可能的解决方案,并且没有得到任何解决方案。

据我所知,没有一个开放的数据库,我可以查询包含实时更新分数,否则我可以捎带或获得类似的系统。

+0

如果有一个服务,存储的数据我敢肯定,他们会收取$$$的。至于抓取网站,并不是一种真正的通用方式,至少我知道,只能打一个网址并知道要提取什么数据。您需要下载html并使用正则表达式或其他方法来查找数据。另外,如果网站的变化甚微,您必须修复并重建。 – user1231231412 2011-12-17 02:33:23

回答

1

查看另一个网站上的这个论坛问题。看起来有几个可以让你获得csv的数据。不知道它有多少可以自动化。

http://ask.metafilter.com/120399/MLB-API

另一个是http://www.baseball-reference.com/我不知道如果他们这样做成绩表,但他们对所有的玩家,游戏等统计数据,他们可能有一些你可以用为好。

最后,你可以检查出http://www.strat-o-matic.com/他们可能有东西或愿意为你创建一个API。

0

如果你在雅虎注意到,他们从STATS LLC得到他们的统计。我不知道它的成本,但你应该检查他们的real-time数据传输服务。

0

刮MLB游戏服务器。它在游戏中实时更新。如果你想要boxscore,刮boxscore.xml(例如)