2012-03-16 224 views
2

我需要在c#中制作一个Windows桌面应用程序,用于从网站下载所有PDF。我有链接到网站,但我面临的问题是,PDF不在网站上的特定文件夹中,但分散在各地。从网站下载所有PDF文件

我需要的是帮助找到所有这些链接,以便我可以下载它们或任何其他可以帮助我解决问题的建议。

感谢在先进的所有帮助。

+4

所以你想写一个蜘蛛? – SLaks 2012-03-16 21:13:43

+0

我相信有很多免费的解决方案可以做到。 – Andrew 2012-03-16 21:16:15

+0

是的,我想我需要一只蜘蛛,但我不知道要搜索什么。现在我已经搜索了蜘蛛,我真的需要这样的东西。 – EaglesNiko 2012-03-16 21:24:29

回答

1
  1. 勉强通过的所有网页
  2. 找到所有的“* .PDF”网址
  3. 重建他们只需下载:)

请再具体些,你试图让所有的来自html页面或整个域名的PDF文件?

+0

我需要从整个域中找到所有的pdf。 – EaglesNiko 2012-03-16 21:22:24

+0

您可以使用谷歌!谷歌为“* .pdf inurl:website”,它应该为您提供所有索引可访问PDF文件的列表。这有帮助吗? – 2012-03-16 21:24:04

+0

我想到了,但我想找到一个更可编程的解决方案 – EaglesNiko 2012-03-16 21:26:58