我想从本网站的表格和段落文本中提取各种元素。 https://www.instituteforsupplymanagement.org/about/MediaRoom/newsreleasedetail.cfm?ItemNumber=30655 这是我使用的代码: import lxml
from lxml import html
from lxml import etree
import
我编写了一个代码来查找xml中特定标记中的文本。它适用于没有子标签的标签。 For e.g. 1 <a>ajsaka</a>. it works fine for this.
e.g. 2 But if there is an instance of <b>ahsjd<c>jjiij</c>aa</b>.
它不工作。我希望标签中的所有内容包括其子元素文本。我想要它打印ahsjdjjiija