0
我想刮这个网站:https://resultadoselecciones2016.onpe.gob.pe/PRP2V2016/Actas-por-Ubigeo.html
我该如何刮这个特殊的jQuery网站与python?
他们正在使用jQuery,所以数据不在“正常”的HTML代码。我看到这个Chrome开发者控制台上:
所以我这样做对Python的2.7:
import urllib
import urllib2
url = 'https://resultadoselecciones2016.onpe.gob.pe/PRP2V2016/Actas-por-Ubigeo.html'
data = "pid=844399127479680.2&_clase=mesas&_accion=displayMesas&ubigeo=140107&nroMesa=034915&tipoElec=10&page=1&pornumero=1"
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
print response.read()
但它不工作,它只是打印正常HTML,而不是你在上面看到的回应。
我该如何获得这些数据?
您需要在您的服务器上运行无头浏览器 – charlietfl
您可以使用Selenium或RoboBrowser执行此类任务。 –