2011-07-16 238 views
-5

如何用Java编写页面抓取工具来抓取网页并获取与某个特定主题相关的信息。在Google上搜索时,我发现youttube上只有1个视频,没有后续部分和Jeff出书Heaton。如果任何人有任何好的链接或知道从哪里开始制作Java页面刮板,请将其发布。用Java编写网络爬虫

+0

“bot”是一个不好的术语。你应该搜索的是一个“页面爬虫”或“页面刮板”。 – Eric

+2

okay.Sorry.Have chnaged它现在 – Sab

+1

我写了一个多线程webcrawler而不使用任何库。也许这是一个很好的起点:http://stackoverflow.com/questions/6005137/make-an-existing-code-in-java-parallel-multithread/6007022#6007022 –

回答