2015-04-24 58 views
0

在我的应用程序的所有实时数据在卡桑德拉表中存储,我有计划使用Apache火花来分析它,并把它分成不同的表,它允许更快的数据读取,我想知道我需要申请哪种设计方法。卡桑德拉和Apache火花DB设计达到datewise过滤

分析relatime表的时限,再放入到每小时,然后分析后使其每日,每周再等等,那么很容易在一个时间范围内实现数据。我的逻辑是好还是用卡桑德拉和火花的其他方法?

+0

不知道您的要求是什么,建议任何解决方案都非常困难。有许多不同的选择可以做同样的工作。 – maasg

+0

@maasg我的目的是收集来自客户端应用程序的数据,并将其存储在cassandra中,而无需修改。我将其称为实时数据,我们可以预计每秒100个记录。需要显示在仪表板上,需要过滤,需要显示不同的日期范围,需要更改状态,需要静音档案等。如果你能提出所有的选择,我会检查它。 – Abdul

+0

他们在这里做类似的事情:https://github.com/killrweather/killrweather如果你有更具体的问题会更好。设计建议主要是关于SO的观点和实际上的主题。 – maasg

回答

1

我认为你的方法很好。它类似于由Nathan Marz设计的Lambda Architecture。欲了解更多信息,请按照这link。希望这会帮助你。

+0

我不确定简单的累计计算如何与lambda体系结构相关。 – maasg