2016-01-01 115 views
2

我想写一个Python代码,将参观皇马的页面上维基百科和将打印的球队的名字的XPath选择包含表

我现在的XPath查询是第一个表:

for t in doc.xpath("//table//table/tr[position() > 1]/td[4]/span//text()"): 
    #print the player's name here 

但是,这也打印了“借出”表中的玩家。

所以我的问题是如何选择只包含xpath查询中的表的第一个表?或者也许有另一种方法来实现我想要的?

非常感谢。

P.S:表格从维基百科页面上的皇家马德里页面的第775行开始(https://en.wikipedia.org/wiki/Real_Madrid_C.F)。

回答

2

您可以使用以下XPath:

(//span[@id='Current_squad']/following::table)[1] 

这将只选择 “当前sqaud” 表。

要得到的球员名单,你可以使用以下XPath:

(//span[@id='Current_squad']/following::table)[1]//span[@class='fn']//text() 
+1

这工作,谢谢! – Kyle

相关问题