2014-10-12 25 views
1

我们试图为我们的交易系统建立数据仓库。
- 我们每天进行5000-6000次交易,他们可以超过20,000。
- 每个交易产生一个文件,大小(> 4MB)实时查询 - 最适合的HBase或Cassandra?

我们希望有一个系统,它可以对现有数据进行更新,保持一致性和可用性,并具有良好的读取性能。基础设施不是问题。

Hbase或cassandra或其他?您的帮助和指导受到高度赞赏。

非常感谢!

回答

0

大多数较新的nosql平台可以在性能方面做你所需要的 - hbase和cassandra都可以水平缩放(也可以是Aerospike等),因此如果数据模型尊重数据的“产品模式”分配。

我不会选择性能方面的技术。 我会做的是:

  1. 由一堆产品提供再考虑一个,开箱即用,最适合我的需要
  2. 操作的列表,我需要不同功能的列表做数据和检查,如果我不打算“”某些特定产品

虽然1是很容易做到的2需要深厚的产品分析。例如,你说你需要更新现有的数据 - 让我们想象你选择了Cassandra,并且非常频繁地更新了一个列,在该列上放置了用于搜索目的的二级索引(即在底层创建了查找表)。任何时候在查找表上对此列执行更新时,都会执行删除和插入操作。您可以在article中看到,在Cassandra中执行许多删除操作被认为是反模式,并且可能导致出现问题的情况。这只是我在Cassandra上做的一个例子,因为它是我在nosql产品中最了解的一个例子,而不是告诉您避开Cassandra。

+0

谢谢卡罗!你对Hbase有任何想法吗?我听说如果我们存储的文件大小小于hfds默认大小,那么性能会有所下降,这是真的吗? – 2014-10-12 09:11:47

+0

我真的不知道,但这正是我在选择产品之前检查一切时的意思 – 2014-10-12 09:27:17

相关问题