因为工作原因,我在使用“driver = webdriver.PhantomJS()”之前能够刮掉以下网站。我所刮的是价格和日期。如何在刮网站时绕过免责声明
https://www.cash.ch/fonds/swisscanto-ast-avant-bvg-portfolio-45-p-19225268/swc/chf
这停止工作前几天,由于我有起初同意免责声明页面。
一旦同意我看到视觉的真实内容,但司机好像不是,打印出来是[],所以它必须与声明的网址是仍。
请参阅下面的代码。
from selenium import webdriver
from bs4 import BeautifulSoup
import csv
import os
driver = webdriver.PhantomJS()
driver.set_window_size(1120, 550)
#Swisscanto
driver.get("https://www.cash.ch/fonds/swisscanto-ast-avant-bvg- portfolio-45-p-19225268/swc/chf")
s_swisscanto = BeautifulSoup(driver.page_source, 'lxml')
nav_sc = s_swisscanto.find_all('span', {"data-field-entry": "value"})
date_sc = s_swisscanto.find_all('span', {"data-field-entry": "datetime"})
print(nav_sc)
print(date_sc)
print("Done Swisscanton")
试图找出是否免责声明设置任何cookie,并做这之前刮。你应该检查你是否遵守免责声明,因为它是有原因的 – Marged
嗨Marget,你可以进一步解释如何检查是否免责声明设置任何cookie?谢谢。 – Shanshan
请看看我的代码,真的很短,只是添加到帖子。 – Shanshan