2
我使用python 3.x和行使使用Beautifulsoap如何使用JavaScript
爬行我想学习如何使用JavaScript
例),爬行网站的爬站
<a id="ContentPlaceHolder1_btnDown"
href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$btnDown','')">
<img src="/images/common/icon/icrobat.gif" alt="emememem"></a>
<a href="javascript:fn_FileDownLoad('NewsLetter/Attach/2016/12/KIPF_161111.pdf',
'_KIPF_161111.pdf');">KIPF_161111.pdf</a>
在此,
通常情况下,我预计
a href="/alal/blablabla.pdf"
所以,我使用的URL,然后我得到了PDF文件。
但是,在第一个代码
"href = javascript:__doPostBack("ct100$ContentPlaceHolder1$btnDown','')"
href="javascript:fn_FileDownLoad('NewsLetter/Attach/2016/12/KIPF_161111.pdf',
'_KIPF_161111.pdf');">KIPF_161111.pdf</a>
在哪里?网址
我以为我得到了硒。所以,如果我使用一个~~~。点击(),我会得到关于PDF文件的URL我想
例如
from selenium import webdriver
driver = webdriver.PhantomJS("C:\phantomjs.exe")
driver.get("http://blablablablablabla.html")
submitButton.click()
吧??
我很困惑。
有一个名为'get_attribute()'的硒,你可以用它来获取方法动态页面的html代码。 – Acepcs