设置梗概:合并集合跨越多个碎片分裂
5×SolrCloud(Solr的4.6.1)节点实例(单独的机器)。
该设置旨在存储最近48小时的webapp日志(这是相当激烈的......〜3MB /秒)
“日志”集合有5个分片(每个节点实例一个)。
一个的logline代表“日志”集合
如果我继续存储日志文件,以这种“日志”的收集,对碎片内核开始变得非常大,CPU图表显示实例花费越来越多的时间中的一个文件等待磁盘I/O。
因此,我的想法是每15分钟创建一个新集合,并将它命名为“logs-201402051400”,分散在5个实例中的碎片。文档编写者一旦创建,就会开始写入新的集合。在某些时候,我会得到收集这样的名单:
...
日志-201402051400
日志-201402051415
日志-201402051430
日志-201402051445
日志-201402051500
...
由于SolrCloud中某些特定时间段内最多有192个集合(〜1000个核心)。看起来搜索性能应该会急剧下降。
所以,我想将目前未写入的集合合并到一个大集合中(但仍分散在5个实例中)。我已经找到了有关如何合并核心的信息,但我如何合并集合?