美好的一天! 我目前正在为阿里巴巴网站制作一个网页抓取工具。 我的问题是返回的源代码没有显示我感兴趣的某些部分。当我使用浏览器检查源代码时,数据在那里,但使用BeautifulSoup时无法检索。 任何提示?使用BeautifulSoup进行网页扫描:检索网站的源代码
从BS4进口BeautifulSoup
def make_soup(url):
try:
html = urlopen(url).read()
except:
return None
return BeautifulSoup(html, "lxml")
URL = “http://www.alibaba.com/Agricultural-Growing-Media_pid144” soup2 = make_soup(URL)
我感兴趣的高亮部分为使用Chrome的开发者工具显示在图像中。但是当我尝试在文本文件中写入时,某些部分(包括突出显示的部分)无处可查。有小费吗? TIA!
他们可能会在js客户端做一些动态的文档写作,也许是为了回应您尚未做出的AJAX请求。 – polhemic
在代码块的代码块部分之下是两个分配吗? – Lori