2013-11-02 40 views
0

前言:不定搜索群集(Solr的VS ES VS Datastax EE)

这个问题是不是要求弹性搜索与Solr的对比Datastax Solr的(Datastax EE)的开放式的比较。 (虽然欢迎评论部分的链接)。

项目:

我一直在建立一个域名类型的Web服务了一段时间。这样做,我意识到这种服务的指数增长。

背景:

我想知道哪些特定的搜索平台可以让我保存和无限膨胀。是的,我意识到你现在可以分裂一块Solr碎片 - 所以如果我有一个20碎片solr云,我可以稍后将它们分割成40个(我想呢?再次...这不是无限的)。不确定在事物的弹性搜索方面。由于Cassandra的体系结构,Datastax(EE)似乎是答案,但(A)由于它们没有提供许可证价格的透明度 - 我必须向他们透露我的earnings我很快就会想起Oracle的流血缓慢地收费策略,因为我这是一个巨大的威慑力量。 (B)当他们说他们将完整的MapReduce与Hive,Sqop,Mahout,Solr和Pig整合在一起时 - 我想我不想花一辈子学习一些不适合我的项目的花花公子。我希望有一个搜索平台,我可以无限期地每个月添加20亿份文档(或任何数量的文档),而不必担心我会在前面创建一个分片太少的集群。

问题:

诚然,我的背景部分被盗用的无知,我想纠正。我的目的不是要冒犯或淡化这些惊人的技术。我只是想知道他们中的哪些可以扩展而不必担心过度生长的碎片[我在这里永远拿出这个词 - 谢谢你在下面的评论]。或者可以吗?不是硬件方面,而是碎片。我可以使用哪个平台,而不必担心其20TB或2PB的未来增长。假设服务器,交换机等的硬件预算是不确定的。

+0

弹性搜索处理增长非常好。您可以毫不费力地在新盒子上添加JVM(节点)。集群将尝试在那里洗牌碎片并保持碎片的平衡。它还可以设置副本并确保它们不在主碎片的同一节点上。永远不是我适用于任何技术的术语。我想在某种程度上,分散的网络开销和在永远*大小的集群上搜集大量查询将变得很大。 – mconlin

+0

@mconlin这是非常有帮助的。我看到有一本关于ES的书,但它看起来像v.9当前版本的v.2。有没有足够的变化足够渲染.2太旧了?什么是最好的学习方式/你如何学习ES?再次感谢... – Chris

+1

.20到.90是非常不同的。他们在自己的网站上有很多很好的帖子和视频,其中包括很好的缩放。我在工作中使用它,并不断学习。 – mconlin

回答

0

关于您的收入,该链接指向启动程序。如果您有资格,这使得软件100%免费。

+0

此链接http://www.datastax.com/startup – phact

1

DataStax Enterprise(DSE)本身不是“搜索平台”。 DSE提供的功能之一是能够搜索存储在Cassandra中的数据。 Cassandra正被用于存储和访问企业运营数据。这个想法是,一旦您确定Cassandra是您的企业运营数据的首选数据存储区,则DSE/Solr集成允许您对该数据执行丰富的搜索。大型企业正在寻求从传统关系型数据库迁移到更先进的平台,如NoSQL数据库,如Cassandra,其中可扩展性和分布式计算(包括多数据中心支持,可调整一致性和强大的操作工具,包括OpsCenter GUI仪表板)是常态。 DSE的Solr集成有利于迁移。