2013-12-20 103 views
1

我需要从以下结构BeautifulSoup解析嵌套div标签

<div> 
A 
    **<div>** 
    B 
     <div> 
     C 
     </div> 
    </div> 
</div> 

<div> 
A 
    **<div>** 
    B 
     <div> 
     C 
     </div> 
    </div> 
</div> 

我曾经选择做这个选择第二个div:

divs = soup.select("div > div") 

但随着第二个div一起和它的内容,它也选择第三个div作为列表的一部分。如何在我的退货清单中只选择标有的div。

回答

0

在Python中,你可以使用以下行:

# select all the div tags in page 
divs = soup.find_all('div') 

for item in divs:  
    inner_div = item.div 

首先,你选择所有div标签,然后你自主选择每一个。如果您想翻译成其他语言,请访问该语言的美丽汤页。