2014-05-24 47 views
0

我正在为销售人员开发应用程序。我无法弄清楚如何在我的应用程序中管理大数据。以下是情景。实时使用cassandra进行大数据处理

我根据以下标准划分位置。

Country => State => City => Territory => Area => Outlet。

我的表格结构来管理日常销售大致如下。

插座ID - 1,2,3,4,5,6 ......

用户ID - EMP001,EMP002,EMP003,EMP004,EMP005,EMP006 ...

产品ID - 78 ,54,21,11,09,83 ..

数量 - 12,34,67,43,70,03 ..

日期&时间 - 2014年1月5日 - 11.00,01/05/2014 - 12.00,01/05/2014 - 14.00 ..

and oth er filelds。 基于上述数据结构,将会有许多报告将被实时查看。

我们每天有100万行插入。我已经将Casandra作为NO-SQL数据库进行了缩小。

现在我需要一个可以查询和管理实时分析的数据库。听说过并阅读有关这些开源工具,如 - Hbase,Pig,Hive,Presto DB,Impala,Sharp,Shark等。

目前我无法判断哪个是最适合我的应用程序实时分析和预测产品销售。

我们将非常感谢您的帮助和指导。

谢谢

回答

1

Presto + Cassandra非常适合你。 Cassandra + Shark也适用。

+0

我想和Presto一起去,但除了Presto网站,我没有找到很多信息。 –