我收到了一个包含一些pdf文件链接的网站。 我希望nutch抓取该链接并将它们转储为.pdf文件。 我使用的Apache Nutch1.6也是我在Java作为如何使用Apache Nutch抓取.pdf链接
ToolRunner.run(NutchConfiguration.create(), new Crawl(),
tokenize(crawlArg));
SegmentReader.main(tokenize(dumpArg));
特林这可以有人帮助我在此