我想创建一个网络蜘蛛,能够从其他网站获得一些有用的信息。 我如何从网站获取文件并存储到我的服务器? 例如: 该文件的网址是http://www.abc.com/attachment.php?aid=abc 我如何让我的网站的用户下载文件时不显示页面http://www.abc.com/attachment.php?aid=abc?asp.net(网络蜘蛛)
0
A
回答
0
0
有很多方法可以去做。
WebClient
类可用于获取网页资源,例如网页。
如果你想抓取一个网站,你还需要解析内容,以便跟踪链接并下载图像和其他资源(CSS,Javascript等......) - 我建议使用一个解析器,如HTML Agility Pack解析HTML以便您可以查询这些资源(您可能还想使用WebClient
下载)。
相关问题
- 1. 阻止网络蜘蛛
- 2. 使用vb.net的网络爬虫/蜘蛛
- 3. Highchart蜘蛛网络图,pointPlacement和tickInterval
- 4. Python网络蜘蛛:如何解决captcha?
- 5. 网络蜘蛛需要的帮助
- 6. 制作网络爬虫/蜘蛛
- 7. 建议想:网络蜘蛛用Perl
- 8. Nutch网络蜘蛛,索引整个网络
- 9. 最佳网站蜘蛛?
- 10. 蜘蛛不爬行网页
- 11. Highchart蜘蛛网图表
- 12. 减慢蜘蛛网址
- 13. 蜘蛛网图Ruby on Rails
- 14. 如何绘制蜘蛛网
- 15. scrapy:蜘蛛中的小蜘蛛?
- 16. 网络蜘蛛如何抓取::之前的内容?
- 17. 客户端JavaScript可以充当网络蜘蛛吗?
- 18. Python的网络爬虫(NameError:名字“蜘蛛”没有定义)
- 19. Ruby网络蜘蛛和搜索引擎库
- 20. php扩展名“PCNTL”适用于网络蜘蛛吗?
- 21. 有人可以建议一个网络蜘蛛吗?
- 22. 当建立一个网络蜘蛛,你应该使用递归?
- 23. 使用多线程来改进网络爬虫/蜘蛛
- 24. 在使用scrapy制作的网络爬虫中调用另一个蜘蛛的一个蜘蛛
- 25. 在蜘蛛情节
- 26. Scrapy DOMAIN_NAME的蜘蛛
- 27. Python的scrapy蜘蛛
- 28. 制作蜘蛛restarable
- 29. 布局像蜘蛛
- 30. Scrapy与Scrapy蜘蛛