2011-06-29 57 views
1

我一直在玩弄YQL来尝试和更好地理解它,因为它看起来像一个非常整洁的服务,但我不得不承认我相当新手当它来到它。我已经完成了一些教程和示例,并在一定程度上理解它。我接下来要做的是尝试从网站上提取统计数据,以便在潜在的球队网站上显示联盟的统计数据,以确定它是否可行。使用YQL和XPath从HTML获取数据

我YQL查询是

select * from html 
where url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594" 

它返回了一些成果,但显然我不需要的全部内容,我只是想拉榜上。我已经设法在本地页面上显示结果,但是当我尝试将结果缩小到团队排名时,我没有在树中返回结果。林假设它与我的XPath

select * from html 
where url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594" 
and xpath="/html/body/table/tbody/tr[3]/td/table/tbody/tr/td[2]/table/tbody/tr[2]" 

作为新我不知道这是可以做到的,只是想知道如果有人能指导我在正确的轨道上还是不错的教程,这种情况下知道。

+0

问题是XPath - 从萤火拉动的XPath时,要小心/ Firefox的,因为它清理表。 http://stackoverflow.com/questions/1678494/why-does-firebug-add-tbody-to-table – cordsen

回答

1

这应该是你想要什么:

SELECT * FROM html 
WHERE url="http://www.nwjhl.com/leagues/standingsTotals.cfm?leagueID=15654&clientID=4594" 
AND xpath="//tr[@class='boxscores_tables1'] | //tr[@class='boxscores_tables2']"