import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soupa = BeautifulSoup(r.content, 'html.parser')
links = soupa.find_all("div", {"class": "header_mage_wrapper has_avatar"})
for link in links:
print link
所以在我运行此代码后,没有任何中断,我得到退出代码0(使用PyCharm),但是根本没有输出。没有输出与美丽的汤find_all
如果我拿走{“class”:“header_mage_wrapper has_avatar”}) 所以只有find_all(“div”),它工作得很好,并且拉出所有的div。我在一个不同的网站上尝试了这个代码,并且没有任何问题,我确信它是一个小的,我还不知道,我只用了一两天的BeautifulSoup,但是我找不到这是因为没有编码错误。
谢谢!
在页面源代码中,您将链接指向我无法找到'header_mage_wrapper has_avatar'。你可以检查吗? – minocha
你是怎么确定有这些类的div的?不是说有这样的类,但是'header_mage_wrapper'看起来像是拼写错误的'header_image_wrapper'。 –
这很可能是你试图解析javascript,需要做一些改变,正如Martijn所说 - 你可能没有正确拼写过类。 –