2016-08-04 32 views
0

我必须从网络上抓取一些数据并执行一些分析。对于爬网,我决定使用Apache Nutch 2.3.1并进行分析,我决定使用Apache Spark。现在我该如何整合Nutch和solr。根据Nutch website,我已经知道它可以支持spark 1.4.1。有人可以确认我的设计desicion是正确的,第二我没有找到这两个整合的教程。可以soneone指导我该如何使用Apache Spark和Apache Nutch

回答