我正在写一个页面scrapper使用美丽的汤,并注意到它有时会尝试解析一个页面,即使它尚未完全加载。检查蟒蛇urlopen是否已完成加载
我在做什么是这样的:
soup = BeautifulSoup(urllib.urlopen(page))
我不是很好的与Python,但我想一定是我知道该页面已完成加载的方式,所以我可以开始报废它。
之所以我知道它并没有等到它全部加载,是因为脚本将在大多数情况下都能正常工作,但会在其他时间出错,说我在页面上查找的元素不存在(然而)
任何人都可以帮我一个这个吗?