1
如果子元素没有文本值,则XPath不返回任何值。在这种情况下,评级没有数据,所以我想要这样说 - 这个孩子没有或没有,而不是忽略它。您的意见非常感谢。如何在没有数据的情况下让XPath在Python中返回'None'?
XML:
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
<rating></rating>
</book>
<book>
<title lang="hindi">Learning XML</title>
<price>39.95</price>
<rating></rating>
</book>
</bookstore>
的Python:
>>> import lxml.html as lh
>>> bk=open('book.xml','r')
>>> bkout=lh.parse(bk)
>>> bk.close()
>>> bkout.xpath('//book/*/text()')
['Harry Potter', '29.99', 'Learning XML', '39.95']
>>> bkout.xpath('//book/* and not(text())/text()')
True
所需的输出:
['Harry Potter', '29.99', '', 'Learning XML', '39.95', '']
or
['Harry Potter', '29.99', None, 'Learning XML', '39.95', None]
谢谢!有效。我一直在寻找XPath中的东西,而不是for循环,但可能不是。我会坚持这样做。 – ThinkCode
这似乎不适用于标签或其他具有属性的标签。例如,你好 ==> [x.text for x in bk.xpath(“”// book/span [@ class =“brightred”]/*)]。如果有多个span标签,则不起作用。我应该修改questin还是开一个新的问题?我想避免冗余!谢谢! – ThinkCode
我认为你应该删除xpath结尾处的“/ *”。在我于6月19日给你的回答中,与