2012-07-05 111 views
1

我需要以极其短的顺序索引大量内容,我尝试了使用Solrnet/solr使用线程和TPL的各种技术,但是速度会有很多不足之处。因此,考虑转而使用Lucene.net索引编写器来创建一个索引(初步我看到几乎是速度提高的一个数量级)。任何“陷阱”都要注意?使用Lucene IndexWriter创建Solr索引

我不太确定是否: 1.基于Trie的数值范围查询将继续可用于通过Solr进行查询。 (我在Lucene中使用NumericFields)? 2.刻面等将继续可用?

还有什么需要注意的?

+0

可能有些事情要做,以提高索引吞吐量与Solr ...你使用什么mergeFactor?你多久做一次?你是什​​么ramBufferSizeMB? – jpountz

回答

1

请参阅Scaling Lucene and Solr关于改善运行时间。

如果你决定去使用Lucene:

  • 你需要一个唯一ID字段该指数将是一个有效的Solr的索引。
  • 模式必须与Solr模式匹配。
  • Lucene版本必须与Solr中的相同。
  • 我认为只要您根据Solr中的要求对各个字段进行索引并使用相同的分析器,范围查询和分面就可以使用。
+0

感谢Yuval,我的挑战是我使用Lucene.net(因此限制为2.9)。我发现在Lucene中的NumericField正在Solr中引发问题。 – Mikos

+0

现在链接已经死机。 – Neth

+1

嘿@Neth,修复了这个链接。 –