2017-10-19 76 views
2

我尝试做一些网页搜刮在网页搜索期间修改HTML内容

目的是根据邮政编码收集所有的补救措施。问题是当我尝试我的代码时,我的列表是空的,因为url根据邮政编码没有改变。这就是为什么我想在修改过程中更改HTML值的原因。

我不知道如何做到这一点。我尝试使用SeleniumXPATH但是我无法找到任何东西。

这里的HTML代码:(红色是我需要改变。)

编辑:的确,我们的目标是根据邮政编码来收集与名称的分页和补救的类型,这这就是为什么我想在报废期间更改HTML内容的原因。

这是我可以暂时做的最好的,我希望你会看到错误

+2

嗨,你需要包括相关的代码。你有什么尝试?也没有人知道如何使用那个不是英文的页面。假设我点击您提供的第一个链接,然后点击*“Spécialistesdu vitrage”*,输入法语邮政编码75020并按搜索按钮。我可以看到分页结果列表。那是你要的吗?那么,如果是这样,Selenium应该能够得到它,不管URL是否改变。请编辑你的问题。 – derloopkat

回答

1

此输入的形式,这是一件好事,因为Selenium具有特殊的功能来处理形式。

from selenium import webdriver 

url = "https://www.maif.fr/services-en-ligne/consultationreparateurs/geolocaliserReparateur.action?view" 
query = "whatever you want to put into the search box" 
driver = webdriver.Chrome() 
driver.get(url) 
webform_input = driver.find_element_by_xpath("//input[@id='adresseInternaute']") 
webform_input.send_keys(query) 
webform_input.submit() 

这里的关键是submit()。它将遍历HTML树,直到它在当前表单中找到一个按钮,这意味着您不必再多写两行来单击搜索按钮。