3
我已经设法拉出了我正在抓取的一个站点的大部分属性,但试图提取div声明器本身内的某些东西的值。获取属性名称,而不是与BS4的值
具体地,假设以下几点:
<div class="item" data-color="red" data-itemid="abc">Red Slippers</div>
我内部数据的itemid> ABC值之后。
我似乎无法得到一些东西,看不到div内的值:即红色拖鞋,这不是我所追求的。
我曾尝试以下,没有运气:
item_id = soup.find('data-itemid')
任何想法?
@NickP:'html5lib'可能未安装。您可能需要下载它。 – Rahul