大家好,我想在scrapy使用XPath从一个HTML块提取所有文字提取文本的XPath scrapy
比方说,我们有这样的块:
<div>
<p>Blahblah</p>
<p><a>Bluhbluh</a></p>
<p><a><span>Bliblih</span></a></p>
</div>
我想提取文字为[“布拉布拉”,“Bluhbluh”,“Blihblih”]。我希望xpath递归查找div节点中的文本。 我听说过尝试过://div/p[descendant-or-self::*]/text()
但它不提取嵌套元素。
干杯! 勒布