2013-08-16 51 views
0

我已经构建了大的倒排索引,并且我已经将我的倒排索引存储为avro格式,我不想将其作为服务公开。我想知道有没有办法将avro文件加载到solr中,以便solr可以索引我创建的倒排索引。使用Avro文件的Solr索引

这是我倒指数的样子:

{"key":"10.08","bucket":0,"itemIds":[161049555960]} 
{"key":"100-1000-pcs","bucket":0,"itemIds":[590143038066]} 
{"key":"11-2972","bucket":0,"itemIds":[130941586664]} 
{"key":"1106200","bucket":0,"itemIds":[111132254095]} 
{"key":"1370","bucket":0,"itemIds":[380680582645]} 

回答

0

您可以使用Apache水槽来处理的Avro源,并使用Solr的水槽,生成索引文件。 (我对Flume不是很熟悉。)

+0

http://blog.cloudera.com/blog/2013/07/morphlines-the-easy-way-to-build-and-integrate-etl-apps - 用于-阿帕奇-的hadoop / –