例如,我想仅抽出Child1,CHILD2和Child3出以下列表,它是H3的第一个实例后和H3的下一个标签之前的如何使用BeautifulSoup查找两个标签之间的所有列表项?
<h3>HeaderName1<h3>
<ul class="prodoplist">
<li>Parent</li>
<li class="lev1">Child1</li>
<li class="lev1">Child2</li>
<li class="lev1">Child3</li>
</ul>
<h3>HeaderName2<h3>
<ul class="prodoplist">
<li>Parent2</li>
<li class="lev1">Child4</li>
<li class="lev1">Child5</li>
<li class="lev1">Child6</li>
</ul>
您可以将lxml用作beautifulsoup4的解析器。就像这样使用:'bs4.BeautifulSoup(response.text,'lxml')' –