我有以下HTML:如何提取从HTML文本(某些字符串后)
<li class="group-ib medium-gap line-120 vertical-offset-10">
<i class="fa fa-angle-right font-bold font-95 text-primary text-dark">
::before
</i>
<span>
abc:
<b class="text-primary text-dark">st1</b>
</span>
</li>
我想提取str1
这abc
后总是会发生的。我能够通过使用XPATH
链接做到这一点:
xpath('.//b[@class = "text-primary text-dark"]')[0].text
但解决方案取决于它是这个特殊的类,它不止一次地出现,而不是总是在同一顺序的第一次亮相。我想知道是否有一种方法来搜索HTML
的abc
并拉动后续文本?
我想知道你是如何在你的问题中获得xpath的'str1'?你得到的是元素'i',其中'str1'在元素'span'' – SomeDude
草率复制粘贴,编辑。 –
只有当元素在列表中时使用[0]才会有所作为,因为它们处于不同的层次上,这无关紧要,对于不同的级别,您需要使用选择器来标识唯一父元素并从那里继续。 – lauda