我刮的网站,我需要从这个HTMLDocument的得到的数值:同时获得父母和孩子文本使用XPath(HtmlXPathSelector)
<td>
<span style=" color: red; font-weight: bold;"> 1.950</span>
</td>
<td> 3.400</td>
我需要提取两个1.950和3.400,但我无法弄清楚如何做到这一点,当一个值只在一个,而另一个也有一个跨度。有没有一种通用的方法来获得父母和孩子的路径?我正在使用scrapy
框架和HtmlXPathSelector
。我可以使用一个路径/td/text()
,另一个使用/td/span/text()
,但我需要在一个查询中完成。这怎么能实现?