元素我想使用硒从这个网站将表读入一个数据帧的大熊猫。 Link here蟒蛇硒找到类返回的整个网站,而不是元素
然而,当我尝试打印Dataframe
出来,它给我的网站上的所有内容,如顶部像website search
,advance search
,以及底部Disclaimer | Hyperlink Policy | Privacy Policy
和©2010 Hong Kong Exchanges and Clearing Limited...
,而不仅仅是表。不知道这里有什么问题。
url = r'https://www.hkex.com.hk/eng/market/sec_tradinfo/stockcode/eisdeqty.htm'
path_to_chrome_driver = r'C:\chromedriver.exe'
driver = webdriver.Chrome(executable_path=path_to_chrome_driver)
driver.get(url)
driver.find_element_by_class_name('table_grey_border').find_element_by_tag_name('tbody')
z = pandas.read_html(driver.page_source, flavor='bs4')
print(z)
注意:我也尝试了下面的代码,但结果仍然相同。
driver.find_element_by_class_name('table_grey_border')
@omri_sasdon我得到了一个TypeError:虽然不能读取类型'WebElement''错误信息的对象。在下面的例外中被忽略的异常:> ' –
@jakewong,这是因为它不是html,请尝试打印res以查看返回的值。 –
我使用了'res.get_attribute('outerHTML')',但仍然无法将它馈送到熊猫中以检索表格。 –