1
我有两台机器。一台机器以伪分布模式运行hbase-0.92.2,另一台机器使用nutch2.x爬虫。 如何配置这两台机器的方式是:一台机器使用hbase-0.92.2作为后端存储,另一台使用nutch-2.x作为爬虫。如何将apache nutch 2.x连接到远程hbase群集
请帮助。请提前致谢。
我有两台机器。一台机器以伪分布模式运行hbase-0.92.2,另一台机器使用nutch2.x爬虫。 如何配置这两台机器的方式是:一台机器使用hbase-0.92.2作为后端存储,另一台使用nutch-2.x作为爬虫。如何将apache nutch 2.x连接到远程hbase群集
请帮助。请提前致谢。
我终于做到了,我很容易做到。 我在这里分享我的经验。可能是它可以帮助某人。
1-更改伪分布式模式下hbase-site.xml的配置文件。
2 - 最重要的事情:HBase的机器上,用你的真实IP网络这样
10.11.22.189主本地主机
HBase的机器的IP取代本地主机IP在/ etc/hosts中= 10.11.22.189 (注:如果你不改变你的HBase的机器的本地主机的IP,远程Nutch的爬虫将无法连接到它)
4-复制/ HBase的符号链接,site.xml中到$ NUTCH_HOME/conf目录
5-开始你r爬虫,并看到它的工作