如何识别div内的id名称？

我正在尝试编写一个程序来识别div中的id并返回id的名称。如何识别div内的id名称？

<div id="page0" class="subpage"> 
     <h2 id="RM10129"> Cold Startes </h2> 
     <div id="RM10129" class="menubox"></div> 
     <div id="RM10129" class="menubox"></div> 
     <h2 id="RM10130"> Main </h2> 
     <div id="RM10130" class="menubox"></div> 
     <div id="RM10130" class="menubox"></div>

我希望我的程序能够返回ID“RM10129”和“RM10130”。这是可能的xpath？

来源

2015-10-02 MarkJ

你目前使用什么包来解析HTML？向我们展示你到目前为止的代码。谢谢。 – alecxe

#include – Foon

您可以使用starts-with()检查id开始与RM：

//div[@id='page0']/div[starts-with(@id, 'RM') and @class = 'menubox']/@id

来源

2015-10-02 13:55:05 alecxe

你可以使用xpath为lxml LIB的一部分：

import lxml.html 

ttt = """<div id="page0" class="subpage"> 
     <h2 id="RM10129"> Cold Startes </h2> 
     <div id="RM10129" class="menubox"></div> 
     <div id="RM10129" class="menubox"></div> 
     <h2 id="RM10130"> Main </h2> 
     <div id="RM10130" class="menubox"></div> 
     <div id="RM10130" class="menubox"></div>""" 


page = lxml.html.fromstring(ttt) 

print page.xpath('.//div[@class="menubox"]/@id')

并继续进一步的验证。

来源

2015-10-02 13:56:43

这个xpath会返回你带有ID page0的DIV中的所有DIV ID。

//div[@id="page0"]/div/@id

来源

2015-10-02 14:19:28

如何识别div内的id名称？

回答

相关问题