我想要使用python的任何网站的废料下载页面来提取有关版本及其下载链接的信息。 我正在学python,想用beautifulsoup来做,但这些页面非常复杂,看起来很难找到这个东西。 在此先感谢如何使用python废除任何网站的“下载页面”
-1
A
回答
3
欢迎来到堆栈溢出! - 我猜你的意思是“刮”,因为“废”意味着“扔掉”。
首先,您必须使用urllib2来创建您想要刮取的页面的文件对象。阅读this了解如何。
然后,您必须通过检查页面的html内容来找出您想要从页面本身获得什么信息。
最后,您将文件对象传递给美丽的汤姆的解析器,并导航HTML以返回您正在寻找的信息。
为了将来的参考,BeautifulSoup有漂亮的文档。如果你想要善于编程,你必须学习如何阅读文档 - 它实际上只是从这里变得更加困难。
+0
除非完全必要的,我倾向于避免'赞成http://docs.python-requests.org/en/latest/ –
+0
@JonClements的urllib2'我如果有人说他们是初学者,我通常会根据标准库提供建议。请求是几个月(或几周,或几年,取决于学生如何投入)。 – kreativitea
相关问题
- 1. 如何报废动态网站与Python
- 2. 如何在网站上报废的所有页面(页面1至无穷大)
- 3. 使用scrapy废除不同的页面
- 4. 如何使用python登录后废弃网页?
- 5. 如何使用.NET下载网站?
- 6. Python - 如何从使用OpenID的网站请求页面
- 7. 如何使用Python遍历网站的页面?
- 8. 如何使用Cookie让访问者访问我的网站的下载页面
- 9. 使用Python的网站下载器
- 10. 如何使用python和BeautifulSoup从网站下载.qrs文件?
- 11. 如何使用python从网站下载mp3文件
- 12. 如何使用python登录网站并下载PDF?
- 13. 如何使用Python从网站下载文本文件?
- 14. 如何使用python登录到网站(wifi登录页面)?
- 15. 如何使用wget下载xhtml网页
- 16. 如何使用perl下载网页?
- 17. 如何使用vapply下载网页?
- 18. 如何使用Wget下载网页?
- 19. 如何使用python中的urllib下载网页(mhtml格式)
- 20. 使用Python从网站下载文件
- 21. 使用python从网站下载文件
- 22. 如何使用WinInet下载ajaxed页面
- 23. 如何使用python从网页下载所有可下载的内容?
- 24. 如何在网页网站中不使用_Layout页面
- 25. 如何使用python访问任何网站的搜索框?
- 26. 如何使用wget在python下载网页(mhtml格式)
- 27. 如何使用python从网页下载.zip文件?
- 28. 如何使用cookie在Python中输入和下载网页
- 29. 如何使用python每隔几秒从网页下载内容?
- 30. 如何下载一个网页并使用python导出为PDF
你的问题是如此模糊,没有人敢回答:) – xtofl