1
<tr id="section_1asd8aa" class="main">
<td class="header">
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td style="font-family: arial,sans-serif; font-size: 11px;>DUMMY TEXT<a href="#">browser.</a>
</td>
</tr>
</tbody>
</table>
</td></tr>
上面是一个示例html,我想从html文件中提取所有类名。 输出:'{“c1”:“main”,“c2”:“header”}'有没有办法使用BeautifulSoup从HTML文件中提取所有类名?
到目前为止你做了什么? –
在这里'c1','c2'是什么?它们很重要吗? – Psidom
@AzatIbrakov到目前为止我能够读取html,我可以获取每个html标签,但这不是我所期待的 –