我想从数据库中下载几个特定的DNA序列。 (http://medicago-mutant.noble.org/mutant/FNBline1.php?id=NF-FN+8113) 我可以轻松解析该页面上的静态链接,并关注它们,但是从下一页我无法获取我想要下载的文件的链接(http://gb.sc.noble.org/cgi-bin/gb2/gbrowse/medicago3_5/?name=CHR02FS001028027)它位于“Go”按钮下。有没有办法获得这些信息,或自动推送该按钮? 该按钮会触发一个javascript,打开一个新窗口并立即开始下载该文件。 我一直在使用urllib2下载网站,但它似乎没有任何意义来解析链接的源代码。Python:抓取网页:需要帮助抓取特定链接或自动点击按钮
-1
A
回答
0
首先,网站提供了一个链接,下载所有文件的tar球?
我对urllib2没有经验,但以我的经验硒(http://docs.seleniumhq.org/)应该能够很容易地做到这一点。只需打开Selenium IDE(一个浏览器插件)并记录您想要下载的链接的ID,然后使用python将其自动化。硒网站提供了详细的说明(http://docs.seleniumhq.org/docs/)。你也可以在SO上搜索,因为这里有很多答案。
还有很多其他的工具,如Watir,Sahi,WatiN等等。你可以在这里找到一个不完整的列表:Web Automation Tool和这里:http://en.wikipedia.org/wiki/List_of_web_testing_tools。
相关问题
- 1. 网页抓取:自动按钮点击
- 2. 需要帮助的网页抓取 - 获取特定的内容...
- 3. 我需要帮助网络抓取
- 4. 需要帮助网页抓取网页及其链接通过自动功能在R
- 5. 从网页抓取值,无需刷新页面或点击按钮
- 6. 网页抓取:按javascript按钮
- 7. 需要关于网页抓取中的字符串匹配的帮助,python
- 8. 需要鼠标点击的网页抓取?
- 9. Scrapy网页抓取工具无法抓取链接
- 10. 抓取与rvest网站(改变页面,点击链接)
- 11. 需要帮助在perl中抓取一个网站
- 12. 网络抓取链接表
- 13. 抓取网页和存储链接
- 14. 网页抓取和链接评估
- 15. 需要帮助,点击一下按钮
- 16. Python - 网页抓取问题
- 17. 在python中抓取网页
- 18. Python的网页抓取 - UnicodeEncodeError
- 19. Python网页抓取data-val?
- 20. 的Python - 网页抓取 - BeautifulSoup
- 21. Python的SSL网页抓取
- 22. Xpath Python网页抓取
- 23. 网页抓取,python和beautifulsoup
- 24. 需要帮助点击的Watir网络驱动器按钮
- 25. 从网页抓取特定信息
- 26. HTMLAgility帮助屏幕抓取
- 27. 网页抓取 - 如何获取一个网络链接的特定部分
- 28. 网页抓取/屏幕抓取
- 29. 网页抓取/抓取的资源
- 30. 网页抓取动态内容与Python
你在用什么刮? (Scrapy等?)这将有助于澄清您正在寻找哪些帮助工具,或者如果您愿意切换库。 – DreadPirateShawn
我使用urllib2模块,但我绝对开放任何解决方案。 – szabadkai
另外,你知道“Go”按钮是否打开一个新窗口,立即开始下载,触发JavaScript事件等?任何有关您当前使用的其他信息(例如urllib2)以及您遇到的具体问题将是理想的问题,以便帮助任何可能提供帮助的人。就目前而言,这个问题有可能导致结果过于开放。 – DreadPirateShawn