Q

solr on hadoop的集成

hadoop
solr

2014-04-04 40 views -1 likes

-1

我已经通过curl命令安装了solr和indexd并执行了搜索活动。现在我想在hadoop上部署它，并在文件被推送到存储目录时自动建立索引。我对Hadoop完全陌生，不知道。那么任何人都可以向我介绍这一点？非常感谢。solr on hadoop的集成

2014-04-04 vsh

A

回答

-1

要添加到亚历山大的答案：有一个教程Cloudera搜索http://www.cloudera.com/content/cloudera-content/cloudera-docs/Search/latest/Cloudera-Search-User-Guide/csug_tutorial.html。

2014-04-05 19:58:45

0

如果您不太了解底层技术，最好查看专门将多个软件包放在一起的供应商产品，并提供围绕其特定组合的培训材料。

具体来说，我会建议看看像CDH from Cloudera。它包括Hadoop，Solr和许多其他的东西，比如Hue。

2014-04-04 11:24:01

0

有些方法可以让文件在目录中登录时自动进行索引。

使用curl - 编写shell脚本并将其作为cron运行。
使用Oozie - 创建shell操作并计划它。
我希望morpline /水槽solr水槽可能工作。

注意：如果您发现有关3的解决方案，请分享。

干杯，卡纳安

2014-06-04 06:55:30 kannan

-1

你可以看到的Solr参考指南（HDFS上运行SOLR）是 https://cwiki.apache.org/confluence/display/solr/Running+Solr+on+HDFS

Solr的有写作的支持和阅读它的索引和事务日志文件到HDFS分布式文件系统

要使用HDFS，而不是一个本地文件系统，你必须使用Hadoop 2.x的

你需要指示Solr使用HdfsDirectoryFactory。还有几个额外的参数需要定义。这些可以通过三种方式设置：

1.通过bin/solr脚本的通过JVM参数。每次你用bin/solr启动Solr时都需要传递这些信息。

2.修改solr.in.sh（或Windows上的solr.in.cmd）以在使用bin/solr时自动传递JVM参数，而无需手动设置它们。

3.定义solrconfig.xml中的属性。这些配置更改需要为每个集合重复，因此，如果您只希望将某些集合存储在HDFS中，那么这是一个不错的选择。

2016-03-24 03:28:12

相关问题

11. MongoDB与Solr集成
12. 蒂卡Solr的集成
13. mongo-hadoop集成问题
14. Hadoop Cassandra集成设计
15. Rails + Apache solr分类集成
16. Solr 6和Nutch 2.3.1集成
17. 将Solr与Mediawiki集成
18. Apache Cassandra与Apache Solr集成
19. Solr和eXist-db集成
20. Apache Nutch和Solr集成
21. 将wordnet与solr集成
22. Lucene.NET/SOLR与ASPDOTNETSTOREFRONT（ASPDNSF）集成
23. 方法集成solr和mysql
24. 将solr与mySql集成
25. 使用PHP集成Solr
26. Hadoop On Demand
27. 的Apache Hadoop和Eclipse的集成
28. 在亚马逊网络服务和本地集成Solr + Hadoop和Nutch + Hbase
29. Django的集成SOLR和Nutch的
30. Jira On Demand与Bamboo集成