有一些网站 - www.elections.am/votersreg ,我想知道如何在本网站使用linux wget标签获取整个信息? 感谢使用Linux wget标签来抓取网站
0
A
回答
1
可以使用wget -r
或安装一个名为“的HTTrack”程序,并用它来的URL镜像到一个文件夹
+0
试试webhttrack。 –
0
另一个答案建议“的wget -r”这可能为你工作。但是,为了最好地“抓住本网站的所有信息”,如你的问题所述,我认为'wget --mirror'或者'wget --mirror --convert-links'将是更强大的解决方案。 -r选项默认为递归的5个级别,其中--mirror提供无限级别的递归。 --convert-links选项将根据需要转换下载文档中的链接,以使其适合本地浏览,如果这是您的目标。
我会在这里的'无限递归'方面小心。这可能会失控,因此您可能需要监视下载进度。您还可以使用--level = depth选项显式定义递归深度。
相关问题
- 1. 使用wget优化网页抓取
- 2. 使用wget抓取网站并限制已抓取链接的总数
- 3. 使用python来抓取一个网站
- 4. 使用curl和xpath来抓取网站
- 5. 使用Python网页抓取particualr标签
- 6. 抓取网站使用PHP
- 7. 使用linux的wget从窗口抓取数据框
- 8. 使用wget提取元标签属性
- 9. scrapy抓取网站
- 10. NodeJS Xray无法抓取到多个网站来抓取数据
- 11. 使gwt网站可以不使用散列符号来抓取?
- 12. 使用wget抓取整个tumblr?
- 13. 网站抓取器每隔几秒就抓取一次网站
- 14. 嵌套标签网页抓取python
- 15. 使用Scrapy递增抓取网站
- 16. 使用Angular js抓取网站
- 17. 顺序抓取网站使用scrapy
- 18. 网站抓取使用zombie.js的问题
- 19. 使用xcode从网站抓取文本
- 20. 建议使用抓取网站内容
- 21. 使用动态页面抓取网站
- 22. 如何使用scrapy抓取网站?
- 23. 安装抓取,网站抓取库
- 24. 如何使用Scrapy和Splash来抓取基于AJAX的网站?
- 25. 如何使用scrapy来抓取网站中的所有项目
- 26. 网站抓取问题网站
- 27. 使用R中的函数来抓取网站,返回“下标越界”错误
- 28. 如何使用Asp.net抓取过程来获取网站的所有网址?
- 29. Scrapy:抓取使用document.write填充目标项目的网站
- 30. apache nutch不抓取网站
什么是“标签”? – 2012-10-03 21:00:15
也许这是指一个“命令”的奇怪方式? – duskwuff
如果你想做一些很酷的东西使用perl和嵌入的LWP :: Simple,你可以加载网站,如果你需要更多的智能perl也包含一些www库来输入内容并提交它。 http://search.cpan.org/~gaas/libwww-perl-6.04/lib/LWP/Simple.pm –