XPath在标准匹配节点之后选择节点

我试图使用XPATH从XHTML文件中提取数据，我有一个场景，我想匹配一个TD元素，然后在它之后获得TD。XPath在标准匹配节点之后选择节点

下面是HTML样本

<tr> 
    <td colspan="3" style="border-top:1px solid rgb(234,234,234);padding:0pt 0pt 16px;width:560px">   </td> 
    </tr> 
    <tr> 
    <td colspan="2" style="font:12px/18px Arial,sans-serif;padding:0 10px 0 0;color:rgb(51,51,51);width:480px" align="right" valign="top"> Item Subtotal: </td> 
    <td style="font:12px/18px Arial,sans-serif;color:rgb(51,51,51);width:80px" align="right" valign="top"> $25.79 </td> 
    </tr> 
    <tr> 
    <td colspan="2" style="font:12px/18px Arial,sans-serif;padding:0 10px 0 0;color:rgb(51,51,51);width:480px" align="right" valign="top"> Shipping &amp; Handling: </td> 
    <td style="font:12px/18px Arial,sans-serif;color:rgb(51,51,51);width:80px" align="right" valign="top"> $0.00 </td> 
    </tr> 
    <tr> 
    <td colspan="2" style="font:12px/18px Arial,sans-serif;padding:0 10px 0 0;color:rgb(51,51,51);width:480px" align="right" valign="top"> Total Before Tax: </td> 
    <td style="font:12px/18px Arial,sans-serif;color:rgb(51,51,51);width:80px" align="right" valign="top"> $25.79 </td> 
    </tr> 
    <tr> 
    <td colspan="2" style="font:14px Arial,sans-serif;padding:10px 10px 10px 0;color:#333;width:480px" align="right" valign="top"> Shipment Total: </td> 
    <td style="color:#333;font:14px Arial,sans-serif;padding:10px 0 5px 0;color:#333;width:80px" align="right" valign="top"> <b> $25.79 </b> </td> 
    </tr>

什么我试图做的是，用了“出货总”拿到TD元素，然后之后它提取从TD元素的值。我设法使用XPath选择元素，但不能找到一种方法来跳转到下一个元素

xhtml = etree.HTML(i.get('content').encode('utf8')) 
result = etree.tostring(xhtml, pretty_print=True, method="html") 
root = html.fromstring(result) 
print root.xpath('//td[contains(text(), "Shipment Total:")]')

它更容易待办事项，在BeautifulSoup，但我使用XPath的限制，任何人都可以帮助，如果这将是可能的吗？

感谢

来源

2013-11-22 Mo J. Mughrabi

为了你选择，你可能有兴趣在此XPath表达式的TD后，立即得到了TD：

//td[contains(text(), "Shipment Total:")]/following-sibling::td

来源

2013-11-22 23:45:02

XPath在标准匹配节点之后选择节点

回答

相关问题