from bs4 import BeautifulSoup
source = """
<div class="div1" style="direction:rtl;text-align:center;clear:both;margin:.1em;margin-bottom:1em;">
<div class="div2" style="direction:rtl;text-align:center;clear:both;margin:.1em;">
"""
soup = BeautifulSoup(source, 'lxml')
for div in soup.find_all('div'):
print div.get('style')
这会给你这样的输出:
direction:rtl;text-align:center;clear:both;margin:.1em;margin-bottom:1em;
direction:rtl;text-align:center;clear:both;margin:.1em;
现在这些都是str
对象。你可以按照你喜欢的方式将它们分成;
和格式。作为认定属性的数量,你可以接近这样的:
for div in soup.find_all('div'):
print len(filter(None , div.get('style').split(';')))
输出:
5
4
获取样式,从拆分';',算什么? –
你尝试了什么? –