0
在我的应用程序的所有实时数据在卡桑德拉表中存储,我有计划使用Apache火花来分析它,并把它分成不同的表,它允许更快的数据读取,我想知道我需要申请哪种设计方法。卡桑德拉和Apache火花DB设计达到datewise过滤
分析relatime表的时限,再放入到每小时,然后分析后使其每日,每周再等等,那么很容易在一个时间范围内实现数据。我的逻辑是好还是用卡桑德拉和火花的其他方法?
在我的应用程序的所有实时数据在卡桑德拉表中存储,我有计划使用Apache火花来分析它,并把它分成不同的表,它允许更快的数据读取,我想知道我需要申请哪种设计方法。卡桑德拉和Apache火花DB设计达到datewise过滤
分析relatime表的时限,再放入到每小时,然后分析后使其每日,每周再等等,那么很容易在一个时间范围内实现数据。我的逻辑是好还是用卡桑德拉和火花的其他方法?
不知道您的要求是什么,建议任何解决方案都非常困难。有许多不同的选择可以做同样的工作。 – maasg
@maasg我的目的是收集来自客户端应用程序的数据,并将其存储在cassandra中,而无需修改。我将其称为实时数据,我们可以预计每秒100个记录。需要显示在仪表板上,需要过滤,需要显示不同的日期范围,需要更改状态,需要静音档案等。如果你能提出所有的选择,我会检查它。 – Abdul
他们在这里做类似的事情:https://github.com/killrweather/killrweather如果你有更具体的问题会更好。设计建议主要是关于SO的观点和实际上的主题。 – maasg