我有一个独特的问题,我需要拉特定属性为每个被每5分钟出场的比赛中,两个主要的问题我已经是:从网站措词棒球成绩表
- 分句数据以交互方式显示它,即MLB.com,ESPN,CBS Sports。
- 找到一个可能会显示实时更新并以文本格式更新的盒子分数的源代码。
我已经做了大量的谷歌搜索,以及寻找可能的解决方案来刮取MLB和CBS Sports的数据。我没有这样的运气,现在有点困难,因为我没有任何新的数据可以玩,但是我一直在寻找可能的解决方案,并且没有得到任何解决方案。
据我所知,没有一个开放的数据库,我可以查询包含实时更新分数,否则我可以捎带或获得类似的系统。
如果有一个服务,存储的数据我敢肯定,他们会收取$$$的。至于抓取网站,并不是一种真正的通用方式,至少我知道,只能打一个网址并知道要提取什么数据。您需要下载html并使用正则表达式或其他方法来查找数据。另外,如果网站的变化甚微,您必须修复并重建。 – user1231231412 2011-12-17 02:33:23